Ora, mas quais são os dados da Ciência de Dados?

Num mundo em constantes transformações, a profissão de analista aparece como uma primeira opção para estudantes de diversos campos disciplinares. Economistas, administradores, sociólogos, estatísticos e mais recentemente cientistas da computação, são alguns exemplos daqueles que pareiam vagas no mercado público e privado para esta função.

Mas o que é de fato um analista?

Uma das primeiras definições encontradas ao consultar o Google, é de que:

“ […] O analista é a pessoa cujo trabalho é realizar análises a partir de um ponto de partida e dividir em partes, até chegar à conclusão de um todo.”

Esta definição – convenhamos, bastante vazia a princípio – nos deixa claro que o que caracteriza um analista não é o simples fato de ele ser chamado de analista, e provavelmente também não é o método escolhido para realizar análises, mas sim o seu objeto. Ainda que possa parecer trivial, ser analista é ser analista de algo, e nesse sentido, grande parte do trabalho é se apropriar do conhecimento necessário sobre o objeto para produzir tais análises. Entretanto, a profissão denominada “The sexiest job of the 21st century” pela revista Harvard (2012) é, na verdade, o analista de tudo – o chamado cientista de dados -.

O termo Ciência de Dados a princípio me soa bastante estranho. Como é possível a existência de uma Ciência dos Dados se estes constituem a base sob a qual se faz a própria ciência? Ora, quais são os dados da Ciência de Dados? Sob quais perspectivas eles são analisados?

É um consenso antigo na comunidade científica que dados dissociados de uma perspectiva teórica não são capazes de informar ou conjecturar novas possibilidades de interpretação da realidade. A progressão do conhecimento científico humano se deu – e é absolutamente dependente – das narrativas cientificas levantadas por uns e combatidas por outros. Os dados, nesse processo foram discutidos apenas em termos de sua veracidade empírica e acurácia do seu uso; enquanto estruturas lógicas contribuintes, sempre dependentes de uma tese central, teóricamente embasada. Por si só, nunca convenceram ninguém de nada, a não ser que fossem contados por sujeitos interessados em reforçar um ponto de vista.

É nesse sentido que, enquanto cientistas sociais, devemos observar com cautela e preocupação a obsessão da sociedade tecnológica com os dados, e com a crença de que estes são capazes de contar – de maneira autônoma -, histórias reais, e embasar processos de tomada de decisão que podem alterar a vida de sujeitos de carne e osso. Sabemos que a sensibilidade do analista só pode ser construída a partir de um esforço honesto de compreensão das teorias (e das práticas) dos campos disciplinares, e, na parte metodológica, é necessário que busquemos nos apropriar de novas tecnologias de análise de dados, inclusive (e talvez, principalmente) aquelas utilizadas na “Ciência de Dados”. Desta forma, espera-se que possamos desempenhar nosso trabalho de maneira técnica e competente nas duas esferas, utilizando metodologias de ponta, assim como forte embasamento teórico, em busca da produção de um conhecimento que seja superior tanto em seu potencial de conhecer, quanto de interferir nos mais diversos espaços da vida social.

Escrito por Rômulo Damasceno

Comentários