Análisis
hashtag #Reto2020 en Instagram
El presente trabajo está enfocado en
el análisis de las publicaciones que incluyeron el #Reto2020, para identificar
palabras claves, temas relacionados y detectar patrones en las publicaciones ya
sea en el contenido de la descripción como en las imágenes que se comparten.
La fuente primaria de información
para esta investigación fueron las publicaciones que usaron #Reto2020 en
Instagram, ya que a través de este objeto de estudio se recuperaron los
siguientes contenidos:
● Número de publicaciones con
#Reto2020.
● Alcances o relaciones con
otros hashtag similares.
● Palabras claves y
coincidencias.
● Imágenes relacionadas.
A continuación se agrega el listado
de las herramientas con las que se realizó el análisis del #Reto2020
a) Google Trends. El resultado obtenido demuestra que de marzo a julio hubo un pico en la búsqueda del tema Reto2020 en la web en los países de México, Costa Rica, Venezuela y Colombia, coincide con los meses en los que hubo mayor confinamiento.
Enlace de exploración: https://bit.ly/2ITx3WD
b) Nube de palabras. Se ingresó la data inicial
recopilada con #reto2020 (sin limpieza -
4500 publicaciones hechas durante el mes de noviembre). La exploración reveló las palabras con
mayor frecuencia, lo cual ayudó a detectar los tópicos que están vinculados a
este hashtag. Tales como: quédate en
casa, cuarentena, vida saludable, mama fit, coach,
amor propio, bienestar y otros.

c)
Voyant Tools. La utilización de esta herramienta se
hizo en conjunto con el software R para obtener un análisis más completo de la
información. Para ello, en R se separó por ngram y se
eliminó stopwords.
El trabajo con R nos ayudó a
identificar y confirmar las palabras clave y el uso de otros posibles hashtags
ya detectados con la herramienta anterior: vida
saludable, cuarentena, coach, transformación y felicidad. Y nos dió el detalle de los ngrams.

Con la data organizada en R,
los resultados obtenidos en Voyant Tools fueron los
siguientes:
● Corpus con 112,113 total de palabras y 14,331 palabras únicas.
● Densidad del vocabulario
0.128
● Promedio de palabras por
oración: 112113.0
● Palabra más frecuente en el
corpus: reto (937); vidasaludable (607); cuarentena
(559); coach (553); transformación (537); felicidad (533); quedateencasa
(515); amorpropio (506); estilodevida
(502); behappy (501). (Estos datos coinciden con los
identificados en R)
● Lista de 25 palabras comunes
en el corpus:

● En relaciones se eligió los
términos con mayor frecuencia (reto2020, cuarentena, quédate en casa y
felicidad) para identificar los temas relacionados a estos. Se encontró:
○ Vida saludable está
relacionado con felicidad, amor propio, mamafit, behappy.
○ Cuarentena relacionado con
coach, juntas es mejor, octubre, transformación
○ Quédate en casa relacionado
con resultados, tiempo de mamá, transformación, cuerpo de playa, corporal.
○ Reto relacionado con 2020,
transformación, creatividad, curvas peligrosas.

Enlace de exploración: https://voyant-tools.org/?corpus=8760e06e62e50eb511a28e0a93cc8510
d)
R - Análisis sentimental. Se identificaron las palabras del corpus que aportan a sentimientos
positivos y negativos, para ello se separó por n-gram
y se filtraron los stopwords.
○ Primero se hizo un recuento
rápido de sentimientos:


○ Se revisó el detalle de las
palabras que apoyaban esta valoración, tomando una lista de las palabras
positivas y negativas más mencionadas en el corpus.

Nota: aquí se observó que las
palabras “cuarentena” y “quédate en casa” destacadas en anteriores búsquedas no
aparecen en esta lista de palabras de análisis sentimental, lo cual nos hace
concluir que posiblemente aún no se encuentran clasificadas en el archivo de
relación de sentimientos, ambas podrían ser consideradas en el grupo de
negativos.
e)
Image Sorter. La descarga de publicaciones de Instagram desde R integraba archivos de
imágenes, esto se aprovechó para hacer una lectura distante de las imágenes que
integraban las publicaciones, los resultado fueron estos:
○ Se organizaron por escala de
color, lo cual agrupó las imágenes que compartían colores similares, se pudo
destacar la predominancia de los azules, blancos, rojos y amarillos.

○ Revisión de imágenes cercana
relacionada al color amarillo, lo cual demuestra que la publicación estuvo
relacionada con el # y el tema de belleza, ejercicios

○ Imágenes con blancos tienden
a ser dibujos mano alzada podrían estar
relacionadas con el tema de creatividad. 
○ Escala de grises relacionado
con fotos en blanco y negro, lo cual tendría relación con el #black&white.

4.
Conclusiones
En la exploración
del hashtag reto2020 durante el mes de noviembre, se aprecia que está ligado a
publicaciones con temas de vida saludable, ejercicios, amor propio, belleza y
creatividad, temas de connotación positiva.
Aunque la
hipótesis inicial del proyecto era encontrar patrones en el texto descriptivo,
la exploración en las herramientas dieron resultado
relacionados a otros hashtag que suelen acompañar a reto2020, lo cual también
nos ayudó a tener una idea mejor del tipo de publicaciones.
A pesar que la
exploración de las publicaciones se hizo en noviembre, mes en el que el
confinamiento había bajado, hubo un gran número de publicaciones que aún se
enmarcaron en tópicos relacionados al covid-19, como “quédate en casa” y
“cuarentena”.
Si bien el hashtag
reto2020 connota un sentimiento de dificultad, es posible decir que las
publicaciones en su mayoría abordaban un sentimiento de positivismo ya que hubo
un porcentaje mayor de palabras que contribuyeron al análisis sentimental. Sin
embargo, queda pendiente identificar si las palabras “cuarentena” y “quédate en
casa” (las cuales tuvieron una frecuencia alta de uso) se enmarcan en
sentimientos negativos.
Referencias
Burdick, A. (Ed.). (2012). Digital humanities. MIT Press.
Fradejas, J. (2020) Cuentapalabras. Estilometría y
análisis de texto con R para filólogos. Universidad de Vallalodid.
Recuperado de: http://www.aic.uva.es/cuentapalabras/
Google Trends (14 de noviembre de 2020). Reto2020. Recuperado de https://bit.ly/2ITx3WD
Kemp,
S. (21 de Julio de 2020). Digital 2020 July Global Stashot. www. datareportal.com. Recuperado de https://datareportal.com/reports/digital-2020-july-global-statshot
Sued,
G. E. (2020). Repertorio de técnicas digitales para la investigación con
contenidos generados en redes sociodigitales. Paakat: Revista de Tecnología y Sociedad.
10(19). http://dx.doi.org/10.32870/Pk.a10n19.498
Silge, J & Robinson, D. (2020). Text
Mining with R: A Tidy Approach. O’Reilly. Recuperado de https://www.tidytextmining.com/index.html
Voyant Tools (24 de noviembre de 2020). Corpus
Reto2020. Recuperado de https://voyant-tools.org/?corpus=8760e06e62e50eb511a28e0a93cc8510