Análisis de sentimientos

Author:
Manuel Araujo
Last Updated:
10 years ago
License:
Creative Commons CC BY 4.0
Abstract:
El análisis de sentimientos o minería opinión es el campo de estudio que analiza las opiniones, sentimientos, valoraciones, actitudes y emociones de la gente en lenguaje escrito. Es un área donde el procesamiento del lenguaje natural, la minería de datos, minería web y minería de texto se encuentran. Por ello, presentamos algunos conceptos necesarios para la comprensión de las características e implementación de estos métodos para la concepción de un sistema de un sistema de análisis de sentimientos.
Tags:
\begin{now}
Discover why over 25 million people worldwide trust Overleaf with their work.
\documentclass[conference,compsoc]{IEEEtran}

% *** MISC UTILITY PACKAGES ***
%
%\usepackage{ifpdf}
% Heiko Oberdiek's ifpdf.sty is very useful if you need conditional
% compilation based on whether the output is pdf or dvi.
% usage:
% \ifpdf
%   % pdf code
% \else
%   % dvi code
% \fi
% The latest version of ifpdf.sty can be obtained from:
% http://www.ctan.org/tex-archive/macros/latex/contrib/oberdiek/
% Also, note that IEEEtran.cls V1.7 and later provides a builtin
% \ifCLASSINFOpdf conditional that works the same way.
% When switching from latex to pdflatex and vice-versa, the compiler may
% have to be run twice to clear warning/error messages.






% *** CITATION PACKAGES ***
%
\ifCLASSOPTIONcompsoc
  % IEEE Computer Society needs nocompress option
  % requires cite.sty v4.0 or later (November 2003)
  \usepackage[nocompress]{cite}
\else
  % normal IEEE
  \usepackage{cite}
\fi

% *** GRAPHICS RELATED PACKAGES ***
%
\ifCLASSINFOpdf
   \usepackage[pdftex]{graphicx}
  % declare the path(s) where your graphic files are
   \graphicspath{{images/}}
  % and their extensions so you won't have to specify these with
  % every instance of \includegraphics
   %\DeclareGraphicsExtensions{.pdf,.jpeg,.png}
\else
  % or other class option (dvipsone, dvipdf, if not using dvips). graphicx
  % will default to the driver specified in the system graphics.cfg if no
  % driver is specified.
  \usepackage[dvips]{graphicx}
  % declare the path(s) where your graphic files are 
  \graphicspath{{images/}}
  % and their extensions so you won't have to specify these with
  % every instance of \includegraphics
  % \DeclareGraphicsExtensions{.eps}
\fi
% graphicx was written by David Carlisle and Sebastian Rahtz. It is
% required if you want graphics, photos, etc. graphicx.sty is already
% installed on most LaTeX systems. The latest version and documentation
% can be obtained at: 
% http://www.ctan.org/tex-archive/macros/latex/required/graphics/
% Another good source of documentation is "Using Imported Graphics in
% LaTeX2e" by Keith Reckdahl which can be found at:
% http://www.ctan.org/tex-archive/info/epslatex/
%
% latex, and pdflatex in dvi mode, support graphics in encapsulated
% postscript (.eps) format. pdflatex in pdf mode supports graphics
% in .pdf, .jpeg, .png and .mps (metapost) formats. Users should ensure
% that all non-photo figures use a vector format (.eps, .pdf, .mps) and
% not a bitmapped formats (.jpeg, .png). IEEE frowns on bitmapped formats
% which can result in "jaggedy"/blurry rendering of lines and letters as
% well as large increases in file sizes.
%
% You can find documentation about the pdfTeX application at:
% http://www.tug.org/applications/pdftex





% *** MATH PACKAGES ***
%
\usepackage[cmex10]{amsmath}
\usepackage{listings}
\usepackage{color}
\usepackage{array}

\renewcommand{\figurename}{Figura}
\renewcommand{\refname}{Referencias}
\renewcommand{\appendixname}{Ap\'endice}

\definecolor{codegreen}{rgb}{0,0.6,0}
\definecolor{codegray}{rgb}{0.5,0.5,0.5}
\definecolor{codepurple}{rgb}{0.58,0,0.82}
\definecolor{backcolour}{rgb}{0.95,0.95,0.92}
 
\lstdefinestyle{mystyle}{
    backgroundcolor=\color{backcolour},   
    commentstyle=\color{codegreen},
    keywordstyle=\color{magenta},
    numberstyle=\tiny\color{codegray},
    stringstyle=\color{codepurple},
    basicstyle=\footnotesize,
    breakatwhitespace=false,         
    breaklines=true,                 
    captionpos=b,                    
    keepspaces=true,                 
    numbers=left,                    
    numbersep=5pt,                  
    showspaces=false,                
    showstringspaces=false,
    showtabs=false,
    tabsize=2
}
 
\lstset{style=mystyle}
 

% A popular package from the American Mathematical Society that provides
% many useful and powerful commands for dealing with mathematics. If using
% it, be sure to load this package with the cmex10 option to ensure that
% only type 1 fonts will utilized at all point sizes. Without this option,
% it is possible that some math symbols, particularly those within
% footnotes, will be rendered in bitmap form which will result in a
% document that can not be IEEE Xplore compliant!
%
% Also, note that the amsmath package sets \interdisplaylinepenalty to 10000
% thus preventing page breaks from occurring within multiline equations. Use:
%\interdisplaylinepenalty=2500
% after loading amsmath to restore such page breaks as IEEEtran.cls normally
% does. amsmath.sty is already installed on most LaTeX systems. The latest
% version and documentation can be obtained at:
% http://www.ctan.org/tex-archive/macros/latex/required/amslatex/math/





% *** SPECIALIZED LIST PACKAGES ***
%
%\usepackage{algorithmic}
% algorithmic.sty was written by Peter Williams and Rogerio Brito.
% This package provides an algorithmic environment fo describing algorithms.
% You can use the algorithmic environment in-text or within a figure
% environment to provide for a floating algorithm. Do NOT use the algorithm
% floating environment provided by algorithm.sty (by the same authors) or
% algorithm2e.sty (by Christophe Fiorio) as IEEE does not use dedicated
% algorithm float types and packages that provide these will not provide
% correct IEEE style captions. The latest version and documentation of
% algorithmic.sty can be obtained at:
% http://www.ctan.org/tex-archive/macros/latex/contrib/algorithms/
% There is also a support site at:
% http://algorithms.berlios.de/index.html
% Also of interest may be the (relatively newer and more customizable)
% algorithmicx.sty package by Szasz Janos:
% http://www.ctan.org/tex-archive/macros/latex/contrib/algorithmicx/




% *** ALIGNMENT PACKAGES ***
%
%\usepackage{array}
% Frank Mittelbach's and David Carlisle's array.sty patches and improves
% the standard LaTeX2e array and tabular environments to provide better
% appearance and additional user controls. As the default LaTeX2e table
% generation code is lacking to the point of almost being broken with
% respect to the quality of the end results, all users are strongly
% advised to use an enhanced (at the very least that provided by array.sty)
% set of table tools. array.sty is already installed on most systems. The
% latest version and documentation can be obtained at:
% http://www.ctan.org/tex-archive/macros/latex/required/tools/


% IEEEtran contains the IEEEeqnarray family of commands that can be used to
% generate multiline equations as well as matrices, tables, etc., of high
% quality.




% *** SUBFIGURE PACKAGES ***
%\ifCLASSOPTIONcompsoc
%  \usepackage[caption=false,font=footnotesize,labelfont=sf,textfont=sf]{subfig}
%\else
%  \usepackage[caption=false,font=footnotesize]{subfig}
%\fi
% subfig.sty, written by Steven Douglas Cochran, is the modern replacement
% for subfigure.sty, the latter of which is no longer maintained and is
% incompatible with some LaTeX packages including fixltx2e. However,
% subfig.sty requires and automatically loads Axel Sommerfeldt's caption.sty
% which will override IEEEtran.cls' handling of captions and this will result
% in non-IEEE style figure/table captions. To prevent this problem, be sure
% and invoke subfig.sty's "caption=false" package option (available since
% subfig.sty version 1.3, 2005/06/28) as this is will preserve IEEEtran.cls
% handling of captions.
% Note that the Computer Society format requires a sans serif font rather
% than the serif font used in traditional IEEE formatting and thus the need
% to invoke different subfig.sty package options depending on whether
% compsoc mode has been enabled.
%
% The latest version and documentation of subfig.sty can be obtained at:
% http://www.ctan.org/tex-archive/macros/latex/contrib/subfig/




% *** FLOAT PACKAGES ***
%
%\usepackage{fixltx2e}
% fixltx2e, the successor to the earlier fix2col.sty, was written by
% Frank Mittelbach and David Carlisle. This package corrects a few problems
% in the LaTeX2e kernel, the most notable of which is that in current
% LaTeX2e releases, the ordering of single and double column floats is not
% guaranteed to be preserved. Thus, an unpatched LaTeX2e can allow a
% single column figure to be placed prior to an earlier double column
% figure. The latest version and documentation can be found at:
% http://www.ctan.org/tex-archive/macros/latex/base/


%\usepackage{stfloats}
% stfloats.sty was written by Sigitas Tolusis. This package gives LaTeX2e
% the ability to do double column floats at the bottom of the page as well
% as the top. (e.g., "\begin{figure*}[!b]" is not normally possible in
% LaTeX2e). It also provides a command:
%\fnbelowfloat
% to enable the placement of footnotes below bottom floats (the standard
% LaTeX2e kernel puts them above bottom floats). This is an invasive package
% which rewrites many portions of the LaTeX2e float routines. It may not work
% with other packages that modify the LaTeX2e float routines. The latest
% version and documentation can be obtained at:
% http://www.ctan.org/tex-archive/macros/latex/contrib/sttools/
% Do not use the stfloats baselinefloat ability as IEEE does not allow
% \baselineskip to stretch. Authors submitting work to the IEEE should note
% that IEEE rarely uses double column equations and that authors should try
% to avoid such use. Do not be tempted to use the cuted.sty or midfloat.sty
% packages (also by Sigitas Tolusis) as IEEE does not format its papers in
% such ways.
% Do not attempt to use stfloats with fixltx2e as they are incompatible.
% Instead, use Morten Hogholm'a dblfloatfix which combines the features
% of both fixltx2e and stfloats:
%
% \usepackage{dblfloatfix}
% The latest version can be found at:
% http://www.ctan.org/tex-archive/macros/latex/contrib/dblfloatfix/




% *** PDF, URL AND HYPERLINK PACKAGES ***
%
%\usepackage{url}
% url.sty was written by Donald Arseneau. It provides better support for
% handling and breaking URLs. url.sty is already installed on most LaTeX
% systems. The latest version and documentation can be obtained at:
% http://www.ctan.org/tex-archive/macros/latex/contrib/url/
% Basically, \url{my_url_here}.
% or 
\usepackage{hyperref}
\hypersetup{
    colorlinks=true,
    linkcolor=blue,
    filecolor=magenta,      
    urlcolor=cyan,
}
 
\urlstyle{same}



% *** Do not adjust lengths that control margins, column widths, etc. ***
% *** Do not use packages that alter fonts (such as pslatex).         ***
% There should be no need to do such things with IEEEtran.cls V1.6 and later.
% (Unless specifically asked to do so by the journal or conference you plan
% to submit to, of course. )


% correct bad hyphenation here
\hyphenation{op-tical net-works semi-conduc-tor}

\begin{document}
%
% paper title
% Titles are generally capitalized except for words such as a, an, and, as,
% at, but, by, for, in, nor, of, on, or, the, to and up, which are usually
% not capitalized unless they are the first or last word of the title.
% Linebreaks \\ can be used within to get better formatting as desired.
% Do not put math or special symbols in the title.
\title{An\'alisis de sentimientos}


% author names and affiliations
% use a multiple column layout for up to three different
% affiliations
\author{
\IEEEauthorblockN{Shaira P\'erez}
\IEEEauthorblockA{Escuela de Computaci\'on\\Licenciatura en Computaci\'on\\
Universidad Central de Venezuela\\
Caracas, Venezuela\\
Email: shairaperez.sp@gmail.com}
\and
\IEEEauthorblockN{Manuel Araujo}
\IEEEauthorblockA{Escuela de Computaci\'on\\Licenciatura en Computaci\'on\\
Universidad Central de Venezuela\\
Caracas, Venezuela\\
Email: manuel.araujo1511@gmail.com}
}
% make the title area
\maketitle

% As a general rule, do not put math, special symbols or citations
% in the abstract
\begin{abstract}
El an\'alisis de sentimientos o miner\'ia opinión es el campo de estudio que analiza las opiniones, sentimientos, valoraciones, actitudes y emociones de la gente en lenguaje escrito. Es un \'area donde el procesamiento del lenguaje natural, la miner\ 'ia de datos, miner\'ia web y miner\'ia de texto se encuentran. Por ello, presentamos algunos conceptos necesarios para la comprensi\'on de las caracter\'isticas e implementaci\'on de estos métodos para la concepción de un sistema de un sistema de an\'alisis de sentimientos.
% 
\end{abstract}

% no keywords




% For peer review papers, you can put extra information on the cover
% page as needed:
% \ifCLASSOPTIONpeerreview
% \begin{center} \bfseries EDICS Category: 3-BBND \end{center}
% \fi
%
% For peerreview papers, this IEEEtran command inserts a page break and
% creates the second title. It will be ignored for other modes.
\IEEEpeerreviewmaketitle



\section{Introducci\'on}
% no \IEEEPARstart
En los \'ultimos años, ha habido un enorme crecimiento
en el uso de medios sociales tales como blogs, microblogs , Twitter y las redes sociales en general para realizar cr\'iticas, calificaciones, recomendaciones y otras formas de expresi\'on en línea. Lo que ha hecho que la opini\'on en línea se convierta en una especie de divisa virtual para negocios que buscan comercializar sus productos, identificar nuevas oportunidades y manejar sus reputaciones. Es por ese crecimiento, que investigan cada vez m\'as nuevas formas de abrir una mina de informaci\'on en estos sitios, para conocer adem\'as de lo anterior, lo que las personas piensan y sienten acerca de sus productos y servicios.\\
Es por todo esto que surge el an\'alisis de sentimientos, como una manera de conseguir esta informaci\'on tan determinante para las empresas y organizaciones. Este de manera b\'asica consiste en CITA determinar la actitud de un interlocutor o un escritor con respecto a alg\'un tema o, la polaridad contextual general de un documento. Los prop\'ositos de este articulo son:

\begin{figure}[!t]
\centering
\includegraphics[width=0.5\textwidth]{mr_tuit.png}
% where an .eps filename suffix will be assumed under latex, 
% and a .pdf suffix will be assumed for pdflatex; or what has been declared
% via \DeclareGraphicsExtensions.
\caption{Mr Tuit: Sistema de An\'alisis de Sentimientos. Por 
\href{http://www.mrtuit.com/}{InfoMrTuit}.}
\label{fig_sim}
\end{figure}

\begin{itemize}
\item  Explicar el funcionamiento de los sistemas de an\'alisis de sentimientos.

\item Presentar las caracter\'isticas de los principales enfoques de soluci\'on para los sistemas de an\'alisis de sentimiento.

\item Mostrar los m\'ultiples usos del an\'alisis de sentimientos.

\item Exhibir las predicciones para esta \'area.

\end{itemize}

% You must have at least 2 lines in the paragraph with the drop letter
% (should never be an issue)

 
\hfill \today
\section{Conceptos generales}
Convengamos en una definici\'on para cada t\'ermino referido posteriormente:\\ 
\begin{itemize}
\item \textbf{Ling\"uistica Computacional:} Es un campo interdisciplinario entre el modelado basado en reglas y el modelado estad\'istico del lenguaje natural desde una perspectiva computacional. Dicho modelado no se centra en ninguna de las \'areas de la ling\"u\'istica en particular, sino que es un campo en el que participan ling\"uistas e inform\'aticos especializados en inteligencia artificial, psic\'ologos cognoscitivos y expertos en l\'ogica, entre otros.CITA
\item \textbf{Procesamiento de Lenguaje Natural:} Es un campo de las ciencias de la computaci\'on, inteligencia artificial y ling\"u\'istica que estudia las interacciones entre las computadoras y el lenguaje humano. El PLN se ocupa de la formulaci\'on e investigaci\'on de mecanismos eficaces computacionalmente para la comunicaci\'on entre personas y m\'aquinas por medio de lenguajes naturales. De manera simple, es el conjunto de instrucciones que una computadora recibe en un lenguaje de programaci\'on dado (formal), que le permitir\'an comunicarse con un humano en su propio lenguaje, (ingl\'es, franc\'es, espa\~nol, etc). CITA 
\item \textbf{Miner\'ia de datos:} Es un campo de la estad\'istica y las ciencias de la computaci\'on referido al proceso que intenta descubrir patrones en grandes vol\'umenes de conjuntos de datos. Utiliza los m\'etodos de la inteligencia artificial, aprendizaje autom\'atico, estad\'istica y sistemas de bases de datos. Siendo el objetivo general la extracci\'on de la informaci\'n y transformarla en una estructura comprensible para su uso posterior. En el uso de la palabra, el t\'ermino clave es el descubrimiento, comúnmente se define como "\textsl{la detección de algo nuevo}" CITA
\item \textbf{Miner\'ia de texto:} Consiste en descubrir, a partir de grandes cantidades de texto, el conocimiento que no est\'a literalmente escrito en cualquiera de los documentos. Esto incluye buscar tendencias, promedios, desviaciones, dependencias, etc. La informaci\'on que se descubre debe ser desconocida incluso por los autores de los documentos que se hayan tomado como punto de partida del proceso. Tambi\'en tiene entre sus objetivos la extracci\'n y visualizaci\'on de la informaci\'on procedente de grandes corpus textuales en un formato que facilite su an\'alisis y la deducci\'on de nuevas conclusiones. CITA
\end{itemize}

\section{Proceso b\'asico de un sistema de an\'alisis de sentimientos}
Mediante el an\'alisis del sentimiento, se aspira entender, en primer lugar, con qu\'e guarda relaci\'on el texto que se analiza. Por ejemplo, interesa saber si la frase en cuesti\'on trata sobre la marca o sobre el concepto que interesa analizar (p. ej. "hoteles"). Idealmente, se querr\'a saber esto pero con mayor nivel de granularidad: ¿a qu\'e se refiere exactamente la frase? ¿A la marca, en general, o a un aspecto del producto o servicio (envase, precio, la habitaci\'on, la atenci\'on recibida, entre otros)?\\ 
Una vez que el sistema tiene claro sobre qu\'e es la opini\'on, el segundo objetivo ser\'a conocer el sentido de esa opini\'on (positiva o negativa, b\'asicamente).\\
Los sistemas m\'as sencillos se limitan a leer una frase y buscar en ella palabras que tienen registradas en su diccionario como buenas o como malas. Si aparece una palabra buena (p. ej. – "estupendo"), es una opini\'on positiva. Si aparece una palabra mala (p. ej. – "decepcionada"), es una opini\'on negativa. Si no encuentran ninguna palabra que, seg\'un su diccionario, exprese algo negativo o positivo, estos sistemas m\'as sencillos suelen hablar de "opiniones neutras", aunque ser\'ia preferible entender que lo que ocurre es que no hay opini\'on como, por ejemplo, si un tweet contiene la frase "Estoy esperando a mi primo en el McDonald’s". Parad\'ojiciamente, muchos de esos sistemas simples tambi\'en dir\'an que una opini\'on es neutra si han encontrado una palabra negativa y otra positiva.\\
A partir de ese mi\'inimo, los distintos sistemas de análisis del sentimiento que hay en el mercado van incrementando su refinamiento y su capacidad de proporcionar información realmente \'util.

\section{Enfoques en la implementaci\'on de los sistemas}
En este punto, es importante recordar que existen diversos \textbf{campos cient\'ificos} implicados en esta \'area por lo que la selecci\'on de un m\'etodo determinar\'a en gran medida el enfoque a utilizar en el desarrollo del sistema. Los enfoques existentes se pueden clasificar de la siguiente manera:\\
\subsection{Enfoque sem\'antico}
se caracterizan por el uso de diccionarios de t\'erminos, \textbf{lexicons}, con orientaci\'on se\'antica de polaridad u opini\'on, es decir, los t\'erminos est\'an clasificados como positivos o negativos b\'asicamente. En principio los sistemas pre-procesan el texto donde, dividen en palabras, eliminan las palabras de parada que sean conveniente (ya que las mismas agregan informaci\'on que puede ser importante para el an\'alisis, por lo que no pueden eliminarse por completo) y una normalizaci\'on ling\"u\'istica por stemming\footnote{Es un m\'etodo para reducir una palabra a su ra\'iz} o lematizaci\'on\footnote{Es un proceso ling\"u\'stico que consiste en, dada una forma flexionada (es decir, en plural, en femenino, conjugada, etc), hallar el lema correspondiente}, y luego comprueban la aparici\'on de los t\'erminos en el lexicon para asignar el valor de polaridad del texto mediante la suma de los valores de polaridad de los t\'erminos. T\'ipicamente los sistemas adem\'as incluyen un tratamiento m\'as o menos avanzado de: 
\begin{itemize}
\item T\'erminos modificadores (como muy, poco, demasiado) que aumentan o reducen la polaridad del o los t\'erminos a los que acompañan.
\item T\'erminos inversores o negadores (como no,tampoco), que invierten la polaridad de los t\'rminos a los que afectan.
\end{itemize}
La ventaja de este enfoque es que los errores son relativamente sencillos de corregir, a\~nadiendo cuantos t\'erminos fueran necesarios, y se podr\'ia obtener una precisi\'on tan alta como se quisiera, simplemente invirtiendo m\'as tiempo en la construcci\'on del \textsl{lexicon}. Sin embargo, el esfuerzo para construir un \textsl{lexicon}, empezando de cero, es muy elevado, porque se basa en mucho trabajo manual, as\'i que en general son menos viables.

\begin{figure}[!t]
\centering
\includegraphics[width=0.5\textwidth]{lexicon_arbol.png}
% where an .eps filename suffix will be assumed under latex, 
% and a .pdf suffix will be assumed for pdflatex; or what has been declared
% via \DeclareGraphicsExtensions.
\caption{Ejemplo de un lexicon de palabras positivas.CITA}
\label{fig_sim1}
\end{figure}
\subsection{Enfoque basado en aprendizaje computacional}
Consiste en entrenar un clasificador usando un algoritmo de  \textbf{aprendizaje supervisado} a partir de una colecci\'on de textos anotados, donde cada texto habitualmente se representa con un vector de palabras,\textsl{bag of words}\footnote{Es un m\'todo que se utiliza en el procesado del lenguaje para representar documentos ignorando el orden de las palabras}, \textsl{n-gramas}\footnote{Es una subsecuencia de n elementos de una secuencia dada.} o \textsl{skip-grams}\footnote{Son una generalizaci\'on de n-gramas donde pueden haber huecos por omisi\'on. Proporcionan una forma de superar el problema de escasez de datos}, en combinaci\'on con otro tipo de características sem\'anticas que intentan modelar la estructura sint\'actica de las frases, la intensificaci\'on, la negaci\'on, la subjetividad o la iron\'ia. Los sistemas utilizan diversas t\'ecnicas, aunque las m\'as populares son los clasificadores basados en SVM \footnote{Support Vector Machines, Maquinas de Soporte Vectorial}, Naive Bayes \footnote{Bayes ingenuo} y KNN {K-Nearest Neighbor, K-vecinos m\'as cercanos}. En las investigaciones m\'as recientes se han empezado a utilizar otras t\'ecnicas m\'as avanzadas, como LSA \footnote{Latent Semantic Analysis, An\'alisis Sem\'antico Latente} e incluso Deep Learning \footnote{Aprendizaje profundo}.\\
La ventaja de los enfoques basados en aprendizaje autom\'atico es que cuesta muy poco construir un analizador de sentimientos a partir de la colecci\'on de textos etiquetados\footnote{Las palabras del texto est\'an etiquetadas con su categor\'ia gramatical(sustantivo,adjetivo,verbo,etc)}, ya que la tarea de modelado reside en el algoritmo. Por ello es relativamente f\'acil construir clasificadores adaptados a un dominio determinado. No obstante, en general necesitan un reentrenamiento completo para portarlos a un dominio diferente, adem\'as suelen ser una caja negra en la que corregir errores o a\~nadir nuevo conocimiento es m\'as complicado, y muchas veces s\'lo es posible ampliando la colección de textos y volviendo a entrenar el modelo.

\subsection{Enfoque basado en aspectos}
Se refiere a determinar las opiniones o sentimientos expresados sobre diferentes rasgos o caracter\'isticas de entidades. Un rasgo puede ser una entidad, un concepto, una etiqueta temática, o, en general, cualquier dimensión de análisis que resulte de interés. Por ejemplo, de un tel\'efono celular, una c\'amara digital, o un banco. Este problema involucra varios sub-problemas, por ejemplo, identificar entidades relevantes, extraer sus rasgos/ caracter\'isticas, y determinar si una opini\'on expresada sobre cada rasgo / caracter\'istica es positiva, negativa o neutral.\\
Es posible ampliar el sistema con diccionarios de usuario, incluyendo definiciones de entidades, conceptos y aspectos propias de cada dominio concreto, se puede dar respuesta a cualquier necesidad de an\'alisis que se plantee.

\section{Evaluaci\'on del sistema}
La precisión de un sistema de an\'alisis de sentimiento es, en principio, cu\'anto coincide con juicios humanos. Esto es usualmente medido mediante precisi\'on y recobrado. Sin embargo, de acuerdo a investigaciones evaluadores humanos normalmente est\'an de acuerdo en un 79\% de las veces. De este modo, un programa acertado un 70\% de las veces se comporta casi tan bien como los humanos, a pesar de que tal precisión pueda no sonar impresionante. Si un programa estuviera "bien" el 100\% de las veces, los humanos a\'un estar\'ian en desacuerdo con \'el alrededor de un 20\% de las veces, puesto que est\'an en desacuerdo lo mismo con cualquier respuesta. Es posible aplicar mediciones m\'as sofisticadas, pero la evaluaci\'on de sistemas de an\'alisis de sentimientos sigue siendo un asunto complejo. Para las tareas de an\'alisis de sentimiento que devuelven una escala en lugar de juicios binarios, la correlaci\'on es una mejor medida que la precisi\'on porque tiene en cuenta cu\'an cercano es el valor predicho del valor esperado.\\
Sin embargo, en función del contexto, las cifras de acierto pueden andar docenas de puntos por debajo de la perfecci\'on. Los motivos m\'as habituales son:
\begin{itemize}
\item \textbf{La complejidad y riqueza de los idiomas} y de los lenguaje permite hacer frases tremendamente complicadas, jugar con conocimiento impl\'icito que no se refleja de forma expl\'icita en los actos de habla o, sencillamente, confiar en el contexto para que se entienda el significado real de lo que queremos decir, contexto que no tiene porqu\'e estar disponible para el motor de an\'alisis. Se pueden detectar las iron\'ias m\'as evidentes, pero no las m\'as sutiles, por ejemplo.
\item En ocasiones, las distintas variedades dialectales\footnote{Hace referencia a las posibles variedades de una lengua} o el argot de los diversos grupos sociales puede impedir el correcto an\'alisis de algunos textos, aunque esto es algo que se puede amortiguar si el proveedor del sistema es suficientemente meticulozo.
\end{itemize}

\section{Usos del an\'alisis de sentimientos}
Los beneficios del an\'alisis de sentimiento son numerosos e importantes.La habilidad de extraer informaci\'on de datos de las redes sociales es una pr\'actica que ya est\'an adoptando organizaciones a nivel mundial.\\
Se ha probado que los cambios en el sentimiento de las redes sociales se corresponden a \textbf{cambios en la bolsa}.CITA\\
La administración de Obama utiliz\'o el an\'alisis de sentimiento para sondear la opini\'on p\'ublica sobre sus pol\'iticas y mensajes de campa\~na antes de las \textbf{elecciones presidenciales} del 2012.\\
Lo habitual es identificar el análisis del sentimiento con su uso en las redes sociales pero, en realidad, su aplicaci\'on va mucho m\'as all\'a. Analizar tweets es importante, pero muchas marcas no se limitan a eso y monitorizan de forma constante toda la web, principalmente aquellos lugares donde es m\'as probable que se viertan opiniones relevantes, como los blogs de temas espec\'ificos.\\
Las marcas que cuentan con un buen motor de an\'alisis del sentimiento, extraen conclusiones y toman decisiones concretas basadas en la informaci\'on que les proporcionan: modificar elementos de su offering, lanzar acciones correctivas cuando detectan un problema con la experiencia del cliente o construir sus mensajes de marketing.
\begin{figure}[!t]
\centering
\includegraphics[width=0.5\textwidth]{ejemplo.png}
% where an .eps filename suffix will be assumed under latex, 
% and a .pdf suffix will be assumed for pdflatex; or what has been declared
% via \DeclareGraphicsExtensions.
\caption{Ejemplo de an\'alisis de sentimeintos en Twitter sobre MasterChef}
\label{fig_sim1}
\end{figure}

\section{Caso de Estudio: Expedia Canad\'a}
La habilidad de entender r\'apidamente actitudes del consumidor y reaccionar adecuadamente es algo que Expedia Canad\'a aprovech\'o cuando se dieron cuenta de que hab\'ia un crecimiento continuo de feedback negativo hacia la m\'usica de uno de sus anuncios de televisi\'on.\\
"\textsl{El peor anuncio, lo repiten tanto que llega a ser molesto, y probablemente no vuelva a usar Expedia solo porque su anuncio es tan irritante.}"\\
El an\'alisis de sentimiento que la marca llev\'o a cabo revel\'o que la m\'usica de uno de sus anuncios llegaba a ser muy irritante tras varias escuchas, y los consumidores se estaban dirigiendo a las redes sociales para desahogarse.\\
Un par de semanas después de que el anuncio se emitiera por primera vez, m\'as de la mitad de los comentarios de la conversaci\'on online eran negativos.\\
En vez de anotarse un fallo con el anuncio, Expedia supo dirigir el sentimiento negativo de una manera divertida y consciente al emitir una nueva versi\'on del anuncio que mostraba c\'omo romp\'ian el viol\'in que tanto molestaba.

\section{Predicciones}
Es dif\'icil especular sobre c\'omo un sistema relativamente inmaduro evolucionar\'a en el futuro, pero hay una creencia general de que el an\'alisis de sentimiento necesita ir m\'as all\'a de una escala unidimensional positiva-negativa.\\
Del mismo modo que la pol\'itica no siempre se puede reducir a una posici\'on en una escala izquierda-derecha, hay algunos tipos de sentimiento que no se pueden colocar en un simple bar\'ometro.\\
En el futuro, para capturar y entender de verdad el amplio rango de emociones que los humanos expresan por escrito, se necesitar\'a una escala multidimensional m\'as sofisticada.\\
¿Se puede medir el escepticismo, la esperanza, la ansiedad, la emoción o la falta de ella? Hasta que esto ocurra el análisis del sentimiento es (literalmente) unidimensional.\\
Las organizaciones estarán más al tanto de las aplicaciones del an\'alisis de sentimiento a su mercado.\\
Veremos un cambio en la percepci\'on de la fiabilidad del an\'alisis de sentimiento. Los usuarios estar\'an m\'as abiertos a la idea de que el an\'alisis autom\'atico de textos dif\'icilmente igualará al desempeño humano.\\
La informaci\'on que se puede extraer de grandes conjuntos de datos (millones de tweets) eclipsar\'a la preocupaci\'on sobre la fiabilidad a nivel granular (un solo tweet).

\section{Conclusi\'on} 
En este art\'iculo, hemos abordado la compleja tarea de explicar el, a\'un naciente, contexto del an\'alisis de sentimientos y algunos conceptos asociados a esta \'area.\\
La informaci\'on constituye, en las condiciones actuales, un recurso econ\'omico altamente valorado no s\'olo por sus propiedades intr\'insecas, sino porque permite, adem\'as, el perfeccionamiento del empleo del resto de los recursos de las organizaciones. De ah\'i que la gesti\'on de la información y del  conocimiento, como estadio superior, cobre cada d\'ia mayor importancia en la elevaci\'on de su competitividad.\\
En este sentido, el an\'alisis de sentimiento es una herramienta poderosa, con la cual se puede obtener una gran cantidad de informaci\'on valiosa para la empresa u organizaci\'on. Y como gran parte de sus datos provienen de fuentes como Twitter, Facebook o blogs, los cuales crecen en vol\'umenes inmanejables la ciencia de datos juega un papel relevante en este proceso, ya que permite el almacenamiento y procesamiento de grandes cantidades de datos.

% the \\ insures the section title is centered below the phrase: Appendix B
\newpage

% http://www.michaelshell.org/tex/ieeetran/bibtex/


\bibliographystyle{IEEEtran}
% argument is your BibTeX string definitions and bibliography database(s)
\bibliography{references}
%
% <OR> manually copy in the resultant .bbl file
% set second argument of \begin to the number of references
% (used to reserve space for the reference number labels box)
%\begin{thebibliography}{1}

%\bibitem{IEEEhowto:kopka}
%H.~Kopka and P.~W. Daly, \emph{A Guide to \LaTeX}, 3rd~ed.\hskip 1em plus
%  0.5em minus 0.4em\relax Harlow, England: Addison-Wesley, 1999.

%\end{thebibliography}




% that's all folks
\end{document}
Análisis de sentimientos

Get in touch

Message received