É hora de encerrar o debate 'Dados são' vs. 'Dados são'

Dados são dados são dados são
  • Na semana passada publiquei uma história com o títuloEsses dados estão incorretos ou esses físicos acabaram de mudar o mundo. Pouco depois, minha caixa de entrada foi inundada com e-mails sobre a história que não eram sobre o conteúdo do artigo, mas sim o erro gramatical em seu título. Como esses gramáticos irados se esforçaram para me lembrar, data é um substantivo no plural, então o título deveria ser Ou estes dados estão incorretos ou Esses físicos acabaram de mudar o mundo.

    Eles não estão errados. O problema é que a versão gramaticalmente correta do título parece afetada como o inferno, porque não é a maneira como as pessoas realmente falam. Este é o motivo pelo qual meus editores não alteraram o título antes de publicá-lo e o motivo pelo qual não vamos alterá-lo agora. Uma enquete informal do Twitter sugere que nossa intuição estava correta:

    Trata-se, sem dúvida, de uma amostra pequena, mas acho que a tendência que ilustra é bastante clara. Isso não significa que as pessoas se sintam menos apaixonadas pelo status gramatical dos dados, no entanto. Na verdade, o Entrada da Wikipedia para dados observa que a palavra gerou uma controvérsia considerável, o que é bastante surpreendente quando você pensa em outras palavras que podem ser rotuladas como controversas.

    A controvérsia origina-se de se os dados devem ou não ser considerados um substantivo contável ou incontável. Como um substantivo incontável, pode ser usado com verbos conjugados no singular, mas historicamente é considerado a forma plural do substantivo contável datum, que é o latim para uma coisa dada (ou seja, existem 69 datum).

    Quando falei com Peter Sokolowski, um lexicógrafo da Dicionário Merriam-Webster, ele me disse que a transição dos dados entre suas raízes históricas e o uso contemporâneo está relacionada a um fenômeno léxico chamado branqueamento semântico , onde o significado original de uma palavra é perdido ou diminuído ao longo do tempo. Um exemplo de branqueamento semântico inclui o uso contemporâneo da palavra literalmente, cuja raiz latina, carta , significa letra. No caso dos dados, eles passaram de coisas dadas para significar algo como uma coleção de informações agregadas quando usadas na fala cotidiana.

    De acordo com Jane Solomon, lexicógrafa do dictionary.com, o uso de dados no singular data do início do século XVIII.

    Na minha opinião profissional, Solomon me disse por e-mail, que é tempo suficiente para que este uso seja considerado uma parte do inglês padrão.

    Salomão disse que entende o desejo de corrigir as pessoas no uso da linguagem. Antes de meados do século XX, a linguística era dominada por um paradigma prescritivista, que buscava delinear o uso correto da linguagem. Ao mesmo tempo, Solomon disse, a língua inglesa estava lutando com gramáticos que queriam latinizar a língua.

    Isso levou à criação de regras gramaticais que não fazem muito sentido no contexto do inglês, Solomon me disse, citando regras contra o término de frases com preposições como um exemplo desse fenômeno. Esse uso é muito comum em inglês, entretanto, e a maioria das pessoas consideraria terminar frases com preposições completamente gramaticais.

    Embora o prescritivismo tenha seus usos, especialmente quando se trata de estabelecer padrões de comunicação dentro das organizações - por exemplo, os guias de estilo usados ​​por muitas organizações de notícias ou a sintaxe de uma linguagem de programação - ele também tem muitos pontos fracos.

    Consulte Mais informação: ‘Criptografia’ significa criptografia, não criptomoeda

    Por um lado, as linguagens naturais estão mudando constantemente e qualquer tentativa de defini-las com um conjunto de regras rígidas e rápidas está fadado a distorcer como essa linguagem é usada na prática. (Isso não impediu alguns grupos de idiomas, como Falantes de francês , de criar organizações dedicadas a manter seus idiomas puros, no entanto.) Além disso, qualquer idioma geralmente tem uma coleção de dialetos e escolher um dialeto como correto tem historicamente usado como uma ferramenta política que muitas vezes tem motivações racistas e classistas.

    Quando falamos sobre o inglês 'correto' ou 'padrão', estamos falando sobre um registro específico de inglês que é usado em certos contextos formais, disse Solomon. O inglês fora do padrão também segue um conjunto de regras e padrões sofisticados, embora seja fácil ignorar isso se você não entender o básico de como o idioma funciona.

    Em meados do século XX, o prescritivismo foi complementado com o descritivismo linguístico, que visa catalogar as maneiras como a linguagem é usada na prática - como usar dados como um substantivo no singular, por exemplo. Na verdade, Sokolowski apontou para o Merriam Webster entrada para dados , que observa que as construções singulares e plurais são padrão em inglês. Assim, Sokolowski me disse pelo Twitter, qualquer pessoa que ‘corrige’ você pelo uso não contábil de ‘dados’ está sendo pedante (e provavelmente rude).

    É trabalho de lexicógrafos como Solomon e Sokolowski determinar o que é considerado uso real baseado na gramática ao compilar uma entrada de dicionário para uma palavra. Mas em que ponto o uso de uma palavra é considerado bastante difundido para justificar sua inclusão em um dicionário?

    De acordo com Solomon, os lexicógrafos usam corpora de linguagem - grandes coleções de material escrito - para analisar como a linguagem é usada na prática e determinar o que deve ser incluído em um dicionário. Ela apontou para o AGORA corpus por exemplo, que contém 5,9 bilhões de palavras retiradas de 20 revistas inglesas diferentes desde 2010. É o maior corpus linguístico disponível e cresce em cerca de 4 milhões de palavras todos os dias.

    Captura de tela do corpus NOW via Jane Solomon

    Solomon usou o corpus do NOW para pesquisar quais verbos têm maior probabilidade de seguir os dados e descobriu que é sete vezes mais provável que apareça depois dos dados, então as pessoas que lêem as notícias têm muito mais probabilidade de encontrar o uso supostamente não gramatical de dados do que a versão gramaticalmente correta. Em suma, o uso de dados mudou claramente no discurso popular e é hora de reconhecer isso.

    Pessoas que dedicam tempo para aprender as regras gramaticais na escola às vezes podem ficar muito, muito apegadas a essas regras específicas, disse Solomon. Embora a gramática definitivamente nos ajude a nos comunicar de uma forma que possa ser entendida por nosso público, ela não está gravada na pedra desde quando aprendemos na escola primária. Os dicionários são um trabalho em andamento.