Processamento de Linguagem Natural em Textos de Mídias Sociais
Aprenda técnicas modernas de NLP para analisar dados de mídias sociais em larga escala, incluindo
extração de dados, pré-processamento, representação vetorial de textos (embeddings),
modelos para extração de conhecimento, compreensão semântica e emocional, e suas aplicações em projetos reais.
"NLP tem sido fundamental para extração de conhecimento de textos de mídias sociais, que contribuí tanto para o desenvolvimento de aplicações e serviços, quanto para auxiliar em estudos de comportamentos sobre sociedade urbanas em larga escala."
Frances A. Santos
Co-Autor, Unicamp
"Textos de mídias sociais são fontes fundamentais para compreender
em larga escala o comportamento humano em sociedades contemporâneas."
Jordan Kobellarz
Co-Autor, UTPFR
"Técnicas computacionais de análise e compreensão de texto devem ser difundidas e desmistificadas,
para que pesquisadores das mais diversas áreas possam percebê-las como ferramentas de análise da realidade."
Fábio R. de Souza
Co-autor, USP
O que você irá aprender com esse material?
Conheça os fundamentos teóricos de NLP aplicados aos desafios científicos
e tecnológicos de lidar com textos gerados por usuários de mídias sociais.
1. Textos de mídias sociais: suas principais características e como coletá-los
As principais características de textos compartilhados por usuários em famosas mídias
sociais, como coletá-los, assim como metainformações e respectivos desafios e limitações
que cada uma dessas fontes de dados apresenta.
2. Pré-processamento Textual
Diversas técnicas para preparar os dados textuais, antes deles serem efetivamente utilizados
por algum modelo de linguagem.
3. Representação de Textos Utilizando Vetores Numéricos
Representações de textos utilizando vetores numéricos, chamados embeddings, capazes de
capturar regularidades sintáticas e semânticas presentes nos textos.
4. Modelagem e Extração de Conhecimento
Diferentes métodos de modelagem e extração de conhecimento, incluindo técnicas de agrupamento de
textos (clusterização), bem como a modelagem de estruturas semânticas latentes no texto, conhecida
como extração de tópicos.
5. Compreensão Semântica e Emocional
Os conceitos de compreensão semântica e emocional, que abragem as tarefas de detecção de intenções,
reconhecimento de entidades nomeadas, análises de sentimentos e emoções, ressaltando os desafios
inerentes a elas.
6. Possíveis Aplicações
Aplicações reais, tais como a recomendação de rotas personalizadas para cidades inteligentes e o caso
de uso na análise de situações politicamente polarizadas, que podem ser desenvolvidas com base no
conhecimento semântico extraído a partir de dados de mídias sociais, considerando a utilização de
diferentes técnicas apresentadas no minicurso.