quinta-feira, 18 de janeiro de 2018

Grupo de cientistas de dados trabalha no primeiro robô-jornalista do Brasil para reportar sobre projetos de leis na Câmara

A  tramitação de projetos de lei na Câmara dos Deputados vai passar a ser acompanhada de perto por um novo setorista: um robô produtor de notícias, o primeiro do tipo no Brasil.
O bot vai produzir automaticamente pequenos textos objetivos com informações do  Medidor de Poderuma base de dados que reune informações sobre leis, políticos e candidatosDesde 2016, a Operação Serenata de amorgrupo por trás do projetoutiliza inteligência artificial para monitorar gastos de deputados federais. O lançamento do robô produtor de notícias está previsto para o segundo semestre deste ano, em tempo paraas eleições de outubro.
Plenário Ulysses Guimarães (By Wilson Dias/Agência Brasil [CC BY 3.0 br (creativecommons.org/licenses/by/3.0/br/deed.en)], via Wikimedia Commons)
Segundo a mentora da Operação Serenata de Amor, Yaso Cordova, fellow da Digital Kennedy School, a ideia é que o bot produza textos informativos e   objetivos deforma ágil e automática.
“Queremos fazer com muito cuidado para dar relevância ao que queremos escrever e não atribuir qualquer   tipo de valor aos projetos de lei nas matérias”disse ao Centro Knight“Não queremos atribuir valores que não são transparentes para o eleitorOpinião é  para os humanos. A ideia é deixar que as pessoas tirem suas próprias conclusões, que é o que  fazemos com a Rosie”, concluiu, se referindo à bot da Operação Serenata de Amor que notifica gastos suspeitos na Câmara dos Deputados por meio do Twitter.
Como  foi dito, o robô-jornalista será capaz de escrever pequenos artigos sobre a tramitação de projetos de lei na Câmara dos Deputados. A equipe da Serenata de Amor quer reunir informações como o patrimônio dos políticos, as doações recebidas pelas campanhas, os projetos de lei  propostos, e também os gastos com cotas e emendas parlamentares.
Além de prover informações sobre deputados  eleitos, a base que está sendo construída com dados públicos disponibilizados pelo Tribunal Superior Eleitoral (TSEdeve também agregar informações sobrecandidatos a outros cargos. Nas eleições de outubroserão disputadas vagas para deputado estadual, federal, senadorgovernador e presidente.
Para coletar e padronizar todos os dados necessários, a Serenata de Amor vai contar com organizações parceirascomo o projeto Congresso em Números“Estruturar todos esses dados de uma mesma forma émuitas vezes o que emperra o trabalho do jornalista”comentou Cordova. “Temos muitos dados disponíveis precisamos juntar tudo”.
ideia é que essa base de dados seja uma ferramenta útil para outros jornalistas encontrarem pautas e estabelecerem relações entre candidatos ou representantes  eleitos“Seria trabalho dos jornalistas navegarpela base de dados e descobrir relaçõesÉ muito parecido com a ideia do Panama Papers”, explicou aoCentro Knight o cientista de dados Irio Musskopfcriador da Operação Serenata de Amor.
Desafios em português
Talvez o maior desafio para o desenvolvimento do robô-jornalista seja a falta de tecnologia disponível em português. Grande parte do conhecimento nesse campo é em inglês –os bots que escrevem artigos  são bem utilizados por veículos como o The Washington Post, que utiliza uma ferramenta chamada Heliograf.
Transpor essa dificuldade é o trabalho da cientista de dados Ana Schwendlerespecialista em processamentode linguagem natural. Ela também trabalha em outro projeto pioneiro no Brasil, a robô conversacional de checagem de fatos Fátima, desenvolvida pelo site Aos Fatos em parceria com o Facebook.
“O processamento de linguagem natural é uma forma de fazer máquinas entenderem o que humanosescrevem”explicou Schwendler ao Centro Knight“Precisamos coletar mais informação de avaliação comoé a estrutura [textual] em português e como fazer uma produção textual de qualidade dentro das regras de portuguêsalgo que não existe ainda”.
expectativa é que o robô  aprendendo a fazer textos cada vez melhores com o tempo, por meio daaplicação de estratégias de aprendizagem de máquina (machine learning) e, mais especificamenteaprendizagem profunda (deep learning). Schwendler explica que, em deep learning, redes neurais artificiaisinspiradas pela estrutura do cérebro humano usam algoritmos para adquirir conhecimento através daexperiência. O robô é treinado a partir de textos  consolidados feitos por humanos.
“Temos exemplos de textos que queremos e a partir disso ele vai aprender”ensina Schwendler. “Com o passar do tempo, melhor ele vai ficandoele vai aprendendo o que é bom e pode aprender a partir daresposta dos usuários. ... Queremos sempre o feedback de pessoas de fora”.
Institucionalização e outros projetos
Operação Serenata de Amor começou em 2016, apoiada por uma campanha de financiamento coletivo. O nometirado de uma marca de bombomé inspirado pelo Caso Toblerone, em que uma política sueca teveque desistir de disputar o cargo de primeiro-ministro por ter comprado um chocolate com o cartão corporativo. O grupo afirma que quer encontrar corrupção em pequenos gastos, mas em volume grande”Além disso, o nome do site é uma brincadeira com os nomes das operações realizadas pela Polícia Federal brasileiracontra a corrupção.
No projeto, Rosie, uma inteligência artificial com nomeinspirado pela robô do desenho animado Os Jetsonsmonitora os reembolsos pagos a deputados federaispor meio da Cota para Exercício de AtividadeParlamentarfundo que custeia alimentaçãohospedagem e outros gastos foram identificados mais de 9 mil reembolsos suspeitos.
Até então, o grupo esteve ligado à empresa de dados Data Science Brigade, mas neste ano a OperaçãoSerenata de Amor vai se tornar uma ONG sob o guarda-chuva da Open Knowledge Brasil. “Para nósvai ser muito importante ter uma instituição nos apoiando a ter novas parcerias”comentou YasoCordova, que será a diretora da Serenata enquanto instituição.
Neste ano de eleições, a equipe da Serenata trabalha em três projetos novos, contando com o Medidor de Poder e o robô. Um deles é o desenvolvimento de uma nova interface para facilitar a verificação os reembolsos suspeitos levantados por Rosie. “Dessa forma, cumpriríamos nossa promessa de facilitar a participação cidadã nos gastos públicos”, afirmou Irio Musskopf.
O outro projeto em desenvolvimento buscar adereçar um problema muito discutido no ano eleitoral brasileiro: a proliferação de notícias falsas na internet. O grupo quer desenvolver uma extensão para browser para identificar conteúdo mentiroso online. O público-alvo é composto por adolescentes e idosos, que geralmente têm menos experiência em mídia, segundo Musskopf.


Publicado 2018-01-12 14:06  no Blog Jornalismo nas Américas

Nenhum comentário: