Por mais que deva assumir-se uma perspectiva crítica relativamente a conceitos como os de «sociedade da informação e do conhecimento» e «inteligência colectiva», é inegável a importância da World Wide Web como fonte de acesso à informação, nomeadamente a informação científica destinada ao público leigo. Tendo em conta a crescente importância da Wikipedia como ponto de partida privilegiado para esse objectivo, procura-se neste artigo avaliar algumas asserções que têm sido apresentadas em sua defesa, nomeadamente através de uma comparação do rigor científico e da clareza de algumas entradas das versões inglesa e portuguesa da Wikipedia.
Publicado na Revista de Comunicação e Linguagens, n.º 38 («Mediação dos Saberes»), Lisboa, Relógio d’Água, Dezembro de 2007.
Revista de Comunicação e Linguagens, n.º 38 («Mediação dos Saberes»), Lisboa,
Relógio d’água, Dezembro de 2007, pp. 129-142.
Licença Creative Commons: distribuição autorizada para usos não comerciais; interdita a cópia, modificação ou qualquer tipo de uso que não mencione a autoria original.
Wishful Thinking ou Golpe de Misericórdia?
A Wikipedia enquanto Nova Forma de Mediação dos Saberes
0.
«Neutral point of view».
Confesso-me fraco adepto do conceito de «inteligência
colectiva», proposto por Pierre Lévy (Lévy, 1997a e 1997b), bem como dos
seus derivados, de que o exemplo mais saliente é possivelmente o (quase
trocadilho) sugerido por Derrick de Kerckhove, «inteligência conectiva» (Kerckhove,
1997). Posto isto, e presumindo que tal é suficiente para que este texto
não seja tomado por uma apologia, volto a dar com a outra mão aquilo que
acabei de tirar, propondo-me a não utilizar daqui em diante1 qualquer outra
referência que não tenha sido encontrada online.
1. «Assume good faith» (ou
«Be liberal in what you accept, be
conservative in what you do»).
Não são necessárias estatísticas para validar aquilo de
que o senso comum já se deu conta: que a Internet ombreia com outros meios
mais clássicos e gutenberguianos enquanto fonte de acesso à informação,
nomeadamente — e é esse o caso que mais nos vai interessar — informação
de carácter científico destinada a não especialistas. É nesse sentido,
aliás, que devem entender-se optimismos como os de Lévy e de Kerckhove: a
democraticidade inscrita na própria arquitectura da World Wide Web e do
código HTML2 fez com que, por vagas — as
webpages pessoais no final da
década de 90 e os blogs nos primeiros anos deste milénio são até à data as
respectivas cristas –, o meio se tornasse um gigantesco repositório de
todo o tipo de conhecimentos, do mais abstruso (a ponto de a própria
expressão «conhecimento» estar à beira da inaplicabilidade) ao mais
meticulosamente sancionado pelas diversas comunidades científicas. É, como
se adivinha, esta última forma de conhecimento aquilo que constitui o
horizonte das conjecturas mais optimistas, que contudo fazem os possíveis
por ocultar a outra face da moeda em artifícios mais ou menos retóricos,
sendo que o mais simplista é nem sequer lhes reconhecer a existência e o
mais refinado o de postular uma espécie de neguentropia do próprio
sistema, que, left to its own devices, expulsaria (ou expulsará, em breve)
o lixo para as «margens», trazendo para o «centro»3 apenas o relevante.
Tem contudo de haver um pouco de verdade nessas alegações
— isto é, um mínimo de fundamentação empírica –, ou depressa elas seriam
refutadas. Encontramo-la, por exemplo, no motor de busca Google, em
particular na fonte do seu sucesso, o algoritmo «PageRank», que permite —
simplificamos por questões de espaço e pertinência, deixando de lado
outros factores que condicionam a precisão do que está a ser afirmado4 —
uma hierarquização das páginas indexadas sob uma determinada
palavra-chave, o que leva a que, numa espécie de bola de neve do tipo «rich
get richer», URLs mais consultadas (presume-se que devido à qualidade dos
respectivos conteúdos) se tornem mais densamente conectadas — com mais «incoming
links» –, aumentando a probabilidade de serem mais consultadas e assim
sucessivamente5. Afinal um método que não anda longe do sistema de
hierarquização de artigos científicos peer reviewed, respectivos autores e
instituições a que estão ligados, mas que ele próprio tem uma face oculta:
o fenómeno de clustering, ou seja, de aglomeração de sites segundo núcleos
temáticos, que faz com que a World Wide Web se assemelhe mais a uma
colecção de ilhas (apesar das pontes a ligá-las) do que a um só
megacontinente da sabedoria. Traduzido em termos mais corriqueiros,
significa isso que o facto de um site ser o mais consultado ou o mais
densamente conectado dos que versam sobre — por exemplo — astrologia em
nada o torna cientificamente correcto, nem sequer neutral, pois não fará
mais do que ir ao encontro das expectativas de quem partilha uma
determinada crença pré-científica.
A mais acutilante objecção a esse suposto sistema de
«selecção darwiniana» é no entanto aquilo que faz com que, como insistia o
próprio Darwin, conduza não à sobrevivência do melhor ou do mais forte e
sim do mais apto a um determinado ambiente: o facto de os conteúdos de
cada página pessoal ou blog possuírem uma característica «autoral» não
confere, por si só, qualquer garantia de que esta será muito consultada,
citada, ou que apareça em lugar de destaque numa busca. Ainda que uma
mutação genética seja fruto do acaso, ao passo que os conteúdos de uma
qualquer URL resultam da intencionalidade de um ou mais autores, só um
processo a posteriori de selecção (pelo ambiente e pelos competidores intra e extra-espécie no primeiro caso, pelos utilizadores — por vezes
também autores — da web no outro) permite decidir se tal resulta numa
«vantagem competitiva». Ora, as vantagens competitivas de um site cujo
objectivo é desmontar a acientificidade da astrologia são bem distintas
das de um outro que a enaltece. Se se quiser (optando agora por um
vocabulário tomado de empréstimo à economia e não já à biologia), oferta e
procura são instâncias tendencialmente independentes entre si, e — sonho
de uma «mão invisível» mais ao alcance do que alguma vez o esteve na
economia real — o mercado é controlado, mesmo que não intencionalmente,
pela procura6. Contudo — e com isso completamos a objecção do início
deste parágrafo –, não há uniformidade nos «bens» que são procurados, mas
tão-só equivalência entre utilizadores: os «crap artists»7 que andam à cata
de provas para alimentar as suas teorias da conspiração estão, a este
respeito, ao mesmo nível de um físico, de um especialista em literatura ou
(caso mais delicado) de um estudante de liceu ou de licenciatura que busca
material para um trabalho escolar.
Tudo parece portanto indicar que os sonhos mais
optimistas de uma «sociedade do conhecimento», de um novo (ou melhor,
finalmente concretizado) iluminismo para a era electrónica, estão à
partida condenados. Na ausência de uma «plataforma» comum e universal —
lembramo-nos das tentativas de fundamentação transcendental da Razão, de
Kant a Apel passando por Habermas, bem como de suspeitas como as de
Lyotard quanto à sua exequibilidade –, jamais a World Wide Web conseguirá
a «transição de fase» entre o reflexo da incomensurabilidade das crenças e
culturas dos seus utilizadores, que ainda é, e a tão exaltada função de
agregador e facilitador dos saberes, verdadeiramente universal e
multicultural. Há contudo um elemento novo a baralhar tanto as
expectativas dos mais cépticos quanto as dos mais incorrigivelmente
optimistas. Na clássica tradição iluminista, trata-se de uma enciclopédia;
no pós-moderno domínio do digital, trata-se de um hipertexto, de um
trabalho cooperativo e de uma obra em permanente actualização — tudo em
simultâneo. Falamos do projecto Wikipedia.
2.
«No original research»8.
Assumindo que propostas como as de Vannevar Bush («Memex»)
e de Ted Nelson («Xanadu») careciam à data de meios tecnológicos de
concretização, verdadeiros projectos de uma enciclopédia acessível de
forma gratuita na Internet — particularmente na World Wide Web, devido às
suas intrínsecas características hipertextuais — tomaram forma logo que o
meio sofreu a grande explosão, isto é, no início da década de 90. Data de
22 de Novembro de 1993 a proposta de uma Interpedia — também ela nunca
levada a cabo –, ainda que tivesse sido necessário aguardar por Março de
2000, quando a Nupedia foi anunciada ao público, para ter disponível na
WWW a primeira enciclopédia simultaneamente online e de livre acesso. À
excepção do suporte e da inerente possibilidade de navegação hipertextual
entre entradas, tratava-se em tudo o resto de uma enciclopédia ao estilo
clássico: cada artigo seria elaborado por um ou mais especialistas na
respectiva área temática, preferencialmente todos detentores de grau
académico equivalente ao doutoramento, nunca sendo aprovado (e portanto
tornado público) sem um demorado processo de peer reviewing. Mais
pormenorizadamente9, depois de adjudicado a um ou mais colaboradores,
teria de ser revisto o seu conteúdo até atingir uma versão estável,
revista a sua forma, e só então poderia aprovado e transposto para um
formato legível por um browser. Entre Março de 2000 e Setembro de 2003,
data oficial da morte deste projecto, foram completados apenas 24 artigos
e 74 estavam em versão provisória, o que mostra bem o quão lentamente se
estava a avançar.
Jimmy Wales, o «cérebro» por trás da
Nupedia, tomou
consciência da morosidade do processo de edição, o que o levou a lançar, a
15 de Janeiro de 2001, um projecto complementar, essencialmente para uma
mais rápida acumulação de informação, que seria depois seleccionada pelos
(então e sempre poucos) autores credenciados de artigos. Seria um
wiki10,
isto é, um conjunto de páginas editáveis — facilmente editáveis, se o
termo de comparação for a criação de páginas em HTML — por qualquer
utilizador, o que permitiria tornar as entradas (em permanente
actualização e expansão) resultado de um esforço verdadeiramente
cooperativo.
Desenvolvido pela primeira vez em meados dos anos 90 pelo
programador Howard (Ward) Cunningham com o objectivo de criar uma «knowledge
base» para facilitar a partilha de informações sobre o desenvolvimento de
software, o remoto antecedente (técnico) da Wikipedia — o
site WikiWikiWeb11 — permitia já, como o faz a esmagadora maioria dos
wikis,
lançar alterações e também, pelo facto de conservar uma base de dados com
o historial de alterações, reverter a uma versão prévia. Esta é uma
característica-chave que complementa a anterior, a de livre edição: se
apenas a versão mais recente ficasse armazenada, rapidamente uma página ou
entrada poderia ser vandalizada — o que, em todo o caso, frequentemente
ocorre –, deitando por terra qualquer objectivo de acumulação e correcção
de conteúdos. Em vez de um sistema de restrição de acesso (ou melhor,
sobrepondo-se a este quando existe, mas muitas das vezes prescindindo
dele, de tal forma que o acesso «activo» se torna verdadeiramente livre e
universal), confia-se que 1) a mera possibilidade de reverter uma
vandalização desencoraje tal tipo de actos; e que 2) na eventualidade de
ocorrer, a sua detecção e remoção/reversão será relativamente rápida (a
Wikipedia, como boa parte dos wikis, apresenta na página de
abertura um link para a lista das alterações mais recentes, o que
acelera esse processo de detecção).
Longe de ser perfeito, o sistema revela-se ainda assim
bastante eficaz no que respeita a este tipo de correcção, a que poderíamos
chamar «negativa» na medida em que previne, pela reversão a versões
anteriores, que o conteúdo se degrade. Basta para tal que os utilizadores
consultem o wiki com alguma frequência e não hesitem em executar as acções
necessárias. Muito mais imprevisível é o processo inverso — a correcção
«positiva», portanto –, isto é, a adição voluntária de novos conteúdos e
o aperfeiçoamento dos existentes. O problema adensa-se se se tratar, como
ocorre com a Wikipedia, de algo que procura conjugar os propósitos de
cientificidade com a total (ou quase total12) abertura a todo o tipo de
colaboradores — de um lado, mesmo a reversão eficaz (leia-se, em tempo
útil) pode ver-se ameaçada quando o número de entradas é demasiado
avultado, como se espera de uma enciclopédia; do outro, a possibilidade de
que qualquer um, leigo ou especialista, possa editar os conteúdos coloca
aparentemente em risco a sua credibilidade.
Ora, é justamente neste ponto que radica o inesperado da
Wikipedia. Melhor: os inesperados. Em primeiro lugar, aquilo que era um
projecto subsidiário, uma forma de aumentar o conjunto de contribuições
para a Nupedia, que manteria uma estrutura clássica, ganhou vida própria,
deixando o seu progenitor definhar (no que toca a conteúdos) e
desmoronar-se (no que toca à sua pesada estrutura de peer reviewing e
edição). Em menos de um mês, a 12 de Janeiro de 2001, a Wikipedia passou a
barreira dos mil artigos, e durante esse primeiro ano de existência
cresceu a uma média mensal de 1500 novas entradas.
Estes números nada revelam contudo acerca da qualidade
desses artigos, o que nos obriga a continuar a argumentação. Temos assim,
em segundo lugar, que a Wikipedia beneficiou daquilo a que poderíamos
chamar um efeito «bola de neve»… ou vários: a menção em sites como o
Slashdot, ainda nesse ano, aumentou tanto o fluxo de
utilizadores passivos quanto o número de contribuidores activos; em Maio
de 2001, estavam já iniciadas várias versões internacionais (em francês,
chinês, holandês, esperanto, hebraico, italiano, japonês, português,
russo, espanhol e sueco); em Outubro de 2002, o recurso a um bot — um
programa que automatiza tarefas — permitiu gerar, sem intervenção humana,
um grande número de entradas sobre cidades dos Estados Unidos a partir dos
dados do U. S. Census; diversas melhorias a nível técnico — como a
capacidade de inserção de fórmulas matemáticas (o que ocorreu em Janeiro
de 2003), ou automatismos similares ao anterior — têm sido também
progressivamente acolhidas.
Do lado dos mecanismos de controlo — terceiro dos pontos
que pretendemos referir –, tem havido um esforço na conciliação entre
aquela que é a sua característica mais apregoada, a livre edição de
artigos13, e a exigência de qualidade destes, não só prevenindo actos de
vandalismo como estimulando a permanente revisão e melhoria dos conteúdos.
A Wikipedia possui por isso um robusto conjunto de
«policies» e «guidelines»
genéricas (recomendações que se pretendem normativas mas cuja
obrigatoriedade não pode ser imposta)14, acompanhadas por acções de
carácter mais pontual — restritas a utilizadores que adquiriram o
estatuto de «administradores» — que consistem em impor temporariamente
limitações à edição de certos artigos (permanentemente no caso das páginas
que enunciam essas mesmas «policies» e «guidelines») e a bloquear
utilizadores.
E finalmente, a quarta e mais importante característica
da Wikipedia, a qualidade dos conteúdos tem vindo a equiparar-se — com
muitas ressalvas que não podem ser ignoradas — à das clássicas
enciclopédias. Mas esse é um ponto que merece uma análise mais cuidada.
3. «Verifiable information only».
São já substanciais as análises — mais ou menos
rigorosas, mais ou menos especulativas, mais ou menos apoiadas em dados
quantitativos — à própria Wikipedia. Andrew Lih, num
artigo sobre as
potencialidades desta enquanto forma de «jornalismo participativo»15,
salienta a novidade de meios online como a Wikipedia na medida em que
criam, na chamada «Pirâmide da Informação», uma nova instância que lhe é
transversal. São, tal como as enciclopédias tradicionais, uma «fonte
secundária» — e portanto concebidas preferencialmente como lugar de
acumulação de «conhecimento» –, mas com a peculiar característica de a
sua actualização ser pelo menos tão célere quanto a categoria que recebe,
strictu sensu, o nome de «informação» (cf. a tabela seguinte). Tal obriga
também a que se repense a categoria do «âmbito temporal», pois
durabilidade e rapidez de actualização deixam de coincidir: desejavelmente
tão durável quanto outras fontes secundárias, por vezes ambicionando a
mais, mas actualizável ao ritmo da «informação», por vezes dos «dados em
bruto».
Tipo de informação | Exemplos de fontes | Tipo de fontes | Âmbito temporal |
Sabedoria | Livros, publicações académicas | Investigação e análise | Anos, décadas, séculos, ad infinitum |
Conhecimento | Revistas, enciclopédias | Fontes secundárias | Semanas, meses, anos |
Informação | Jornais, revistas, noticiários televisivos, outras fontes noticiosas |
Fontes primárias | Minutos, horas, dias, semanas |
Dados em bruto | Cotações da bolsa, resultados desportivos e eleitorais, estatísticas económicas, inquéritos e entrevistas, conferências de imprensa |
Recepção directa | Instantes, segundos |
Relação entre fontes jornalísticas e a pirâmide da informação (in Lih,
2004a, p. 5)
O objectivo de Lih no artigo — objectivo apenas
tangencial ao nosso — é, dentro desse quadro conceptual, o de demonstrar
como se processa a interacção entre a cobertura jornalística de
acontecimentos (uma das ilustrações são os atentados bombistas de Madrid
em 2004) e as respectivas entradas na Wikipedia: não só esta tem
progressivamente assumido o papel de fonte jornalística (em particular —
mas não exclusivamente — em dossiers retrospectivos) como os
acontecimentos mais noticiados são de modo geral os mais editados,
tendencialmente ao ritmo a que as notícias em torno destes se sucedem16,
como que a confirmar mais uma vez a hipótese do agenda-setting. Ainda mais
importante para a nossa argumentação: as edições tendem a ser — embora
seja difícil prová-lo empiricamente17 — contributos positivos, i. e., ou
acrescentam elementos novos ou são correcções ao que constava de edições
anteriores.
Note-se contudo que Andrew Lih se concentra em entradas
ligadas (mesmo que de forma indirecta) a acontecimentos recentes, deixando
para trás — excepto como termo comparativo — aquilo que ele mesmo
designa como «benchmark subjects» — entradas como «World_War_II» ou «Hinduism»,
mais estáveis tanto do ponto de vista temporal quanto do seu estatuto
enquanto «conhecimento». É pensando neste tipo mais clássico de entradas
que Todd Holloway, Miran Božičević e Katy Börner relembram, no artigo «Analyzing
and Visualizing the Semantic Coverage of Wikipedia and its Authors», as
críticas habitualmente apontadas ao rigor da Wikipedia:
«Wikipedia’s reliability as a source of information has been repeatedly
questioned in the media and debated in its communities. Critics see two
main flaws: persistent inaccuracies and systemic bias.
The inaccuracies stem from the lack of an authority or a peer review
process that would verify every piece of information entered into
Wikipedia. Users voluntarily review new edits, and while vandalism and
self-promotion get identified and reverted quickly, small errors and bad
writing may remain on display for significant periods. In early July 2005,
for example, an erroneous report of the death of comic strip author Jeph
Jacques remained online for two days, surviving through 10 edits.
As a result, Wikipedia is most often not admitted as a reliable
bibliographic reference. […]
A systemic bias arises because English Wikipedia authors are
necessarily Internet users with decent knowledge of the language, enough
free time to contribute, and sufficient technical facility to edit a wiki
page. Wikipedia coverage tends to favor topics of interest to such users.
In October 2004, for example, the article about Hurricane Frances was five
times the size of one on Chinese art. Wikipedia itself reports imbalanced
coverage by geographic area favoring North America, Japan, Western Europe,
Australia and New Zealand, significantly more pronounced than in
editorially created English language encyclopedias. Wikipedians concede
this imbalance as inevitable, with hope it will decrease as the content
grows.
A third issue is the non-persistence of Wikipedia entries due to
continuous update. This makes the value of citing Wikipedia entries
questionable.» (Holloway, Božičević e Börner, 2006, pp. 4-5)
Por mais que possamos depreciar a terceira das críticas
— como que dizendo que «não é defeito, é feitio», já que essa é
característica comum a tudo o que se encontra na web, que obriga a
mencionar, além da localização dum recurso, a data em que foi acedido –,
já a mesma despreocupação não pode manter-se no caso das anteriores: os
«enviesamentos» culturais continuam a privilegiar as imagens
ocidentalizadas (se não mesmo apenas anglo-saxónicas, ou, no limite,
exclusivamente americanas) do mundo e há incorrecções que escapam aos
olhares de quem poderia eliminá-las (ou, sendo detectadas, falta a
iniciativa por parte do leitor especialista). A rectificação dos
desequilíbrios linguísticos e culturais tem sido lenta; firme se pensarmos
apenas na multiplicação de versões locais (segundo critérios linguísticos
ou nacionais), mais frouxa se se tiver em conta que a essas diferentes
versões não corresponde um intercâmbio de perspectivas entre os
respectivos conteúdos: a máxima do
«Neutral Point of View» é um ideal
difícil de atingir, mas pelo qual não pode deixar de se lutar.
Quanto às «incorrecções persistentes», devemos voltar a
nossa atenção para um recente
estudo da revista Nature, publicado na
edição de 15 de Dezembro de 2005 (Giles, 2005a e 2005b, esta última
referência correspondendo às
notas explicativas). Depois de escolhida uma
amostra de cinquenta artigos da Wikipedia e da versão online da
Encyclopaedia Britannica sobre as mais variadas áreas disciplinares, cada
par de artigos foi enviado a um especialista, pedindo que fossem
identificadas as imprecisões segundo três grandes categorias18: erros
factuais, omissões cruciais e afirmações ambíguas. Deixemos que o artigo
relate os resultados:
«Only eight serious errors, such as misinterpretations of important
concepts, were detected in the pairs of articles reviewed, four from each
encyclopaedia. But reviewers also found many factual errors, omissions or
misleading statements: 162 and 123 in Wikipedia and Britannica,
respectively.» (Giles, 2005a, citado a partir de fonte online)
A média é de quatro incorrecções por artigo na Wikipedia
contra «apenas» três na Britannica: um empate técnico que é confirmado
pelo mesmo número de erros classificados como grosseiros em ambas as
enciclopédias. A surpresa reside tanto na (relativamente) reduzida
quantidade de erros numa enciclopédia aberta a todo o tipo de
colaboradores quanto na persistência de erros equivalentes numa outra que
se esperaria à prova dessas incorrecções. As manifestações foram por isso
de júbilo para Jimmy Wales — «“I’m pleased”, he says. “Our goal is to get
to Britannica quality, or better.”» (idem, citado a partir de fonte
online) — e de incredulidade por parte dos editores da Britannica, que
num primeiro momento menorizaram os resultados do estudo e posteriormente
(em Março de 2006) os
contestaram:
«Nature’s research was invalid. As we demonstrate below, almost
everything about the journal’s investigation, from the criteria for
identifying inaccuracies to the discrepancy between the article text and
its headline, was wrong and misleading. Dozens of inaccuracies attributed
to the Britannica were not inaccuracies at all, and a number of the
articles Nature examined were not even in the Encyclopaedia Britannica.» (Encyclopedia
Britannica, Inc., 2006, p. 2)
A revista Nature não recuou na sua posição, tendo em
contra-resposta (Nature,
2006a e
2006b) relembrado que se tratava de
comparar versões online, o que explica alegações como a de que alguns
artigos não faziam parte da edição em papel — nalguns casos a versão
online da Britannica redirecciona automaticamente para o Britannica Book
of The Year ou para a Student Encyclopedia, e foram então essas as
entradas comparadas com a Wikipedia. Ainda noutros casos a disputa dizia
respeito ao estatuto das omissões cruciais — o que é «crucial» para
alguns parece ser «secundário» para outros e vice-versa — ou a factos e
teorias ainda não totalmente estabelecidos, e acerca dos quais há um
«conflito de interpretações». Ainda que se aceite a refutação por parte
dos editores da Britannica, note-se contudo que se tratava de uma defesa
dos seus conteúdos e nunca de um ataque aos da Wikipedia, o que pelo menos
deixa esta última numa posição confortável relativamente àquilo que temos
estado a averiguar, isto é, a sua validade enquanto instrumento de
pesquisa e de aquisição de conhecimentos.
Há contudo um outro tipo de teste que desejaríamos ver
realizado em larga escala num futuro próximo, e que permitiria até certo
ponto cruzar as duas objecções fundamentais acima assinaladas pelo artigo
de Holloway, Božičević e Börner: serão outras versões da Wikipedia que não
a de língua inglesa igualmente fiáveis?
4.
«Be bold… but don’t be reckless! (AKA: Perfection not required)».
Tendo em conta as comedidas intenções deste artigo, que
se quer preliminar e não definitivo, servir-nos-á uma breve amostra, com o
seu quê de aleatório, tomada de empréstimo a um campo científico que nem
sequer é o nosso. Pretende-se com esta abordagem emular aquela que
acreditamos ser a situação mais comum de consulta à Wikipedia (ou a
qualquer outro tipo de enciclopédia), a do leigo que pretende, fruto da
mera curiosidade intelectual ou de alguma necessidade esporádica, saber um
pouco mais sobre um assunto ou sobre uma área do conhecimento. A
coincidência temporal entre o início da escrita deste texto e a aquisição
de um livro de divulgação científica intitulado Seven Deadly Colours
serviu por isso de ponto de partida para a breve resenha que se segue.
Seven Deadly Colours, da autoria do zoólogo britânico
Andrew Parker, procura apresentar, em cada um dos sete principais
capítulos, outras tantas cores e — mais importante, pois é isso que rege
a escolha de cada cor e não o inverso — outros tantos modos pelos quais a
percepção da cor está presente nos animais e qual a sua importância na
adaptação ao meio. Desse livro retivemos uma lista de conceitos cujas
definições foram de seguida procuradas na
versão inglesa da Wikipedia (a
que iniciou o projecto e que ainda hoje é a que contém mais entradas) e na
versão portuguesa (ou melhor, luso-brasileira).
Para que não nos alonguemos, eis o resultado
(simplificado e reduzido a indicadores quantitativos) dessa pesquisa19:
Versão inglesa | Versão portuguesa | ||||||
Entrada | A | B | C | Entrada | A | B | C |
Adenosine triphosphate | 7,5 | 3 | 12 | Adenosina tri-fosfato | 1,5 | 2 | 0 |
Benham’s top | 1 | 1 | 3 | — | — | — | — |
Bioluminescence | 6 | 4 | 0 | Bioluminescência | 0,5 (órfão) | 0 | 0 |
Camouflage | 6 | 7 | 8 | Camuflagem | 1 | 1 | 0 |
Chromatophore | 7 | 6 | 35 | Cromatóforo | 0,5 | 0 | 0 |
Cone cell | 3 | 1 | 3 | Cone (célula) | 0,5 | 0 | 0 |
Diffraction | 10 | 8 | 0 | Difração | 2 | 1 | 1 |
Electromagnetic spectrum | 6 | 4 | 0 | Espectro eletromagnético | 0,5 | 0 | 0 |
Fluorescence | 5 | 2 | 0 | Fluorescência | 0,5 | 1 | 0 |
Mimic | 2,5 | 2 | 0 | Mimetismo | 1 | 1 | 0 |
Phosphorescence | 1,5 | 1 | 0 | Fosforescência | 0,5 | 0 | 0 |
Photonic crystals | 1,5 | 1 | 0 | — | — | — | — |
Photosynthesis | 9 | 3 | 7 | Fotossíntese | 4 | 0 | 0 |
Pigment | 9 | 17 | 10 | Pigmento | 3 | 0 | 0 |
Polarization | 13 | 8 | 9 | Polarização20 | 5 | 1 | 6 |
Retina | 5 | 4 | 7 | Retina | 2 | 2 | 0 |
Rhodopsin | 2 | 3 | 0 | Rodopsina | 1,5 | 2 | 0 |
Sonoluminescence (redireccionado de Shrimpoluminescence) |
4 (menos de meia página) | 2 (0) | 6 (1) | — | — | — | — |
Tyndall effect | 0,5 | 1 | 0 | Efeito Tyndall | 0,5 | 0 | 0 |
Legenda: A — Extensão aproximada do texto (ecrãs); B — Número de
ilustrações; C — Número de referências bibliográficas21
Os números do quadro praticamente dispensariam qualquer
comentário, a que contudo não nos furtamos. Duas das entradas («Benham’s
Top» e «Photonic Crystals») não existem na versão portuguesa, e no caso de
uma terceira («Shrimpoluminescence», que na versão inglesa redirecciona
para o artigo mais lato «Sonoluminescence») em que o termo procurado é uma
curta secção de menos de meia página, a ausência estende-se a qualquer das
alternativas. Nos casos em que há entradas tanto na versão inglesa quanto
na portuguesa, a regra é a de que nesta última elas sejam quase
invariavelmente mais curtas, com muito menos ilustrações e, salvo duas
raras excepções («Polarization» e «Diffraction»), desprovidas de
referências bibliográficas. Em regra, os artigos na versão portuguesa são
três a cinco vezes menos extensos, exceptuando-se as situações em que
ambas as versões são relativamente curtas ou mesmo «stubs» — isto é,
esboços com menos de um ecrã –, e um ou outro caso («Retina», «Photosynthesis»)
em que a disparidade de tamanhos se reduz um pouco.
Não quer isto dizer — longe disso, aliás — que a edição
inglesa é infalível. Também nesta seriam desejáveis mais referências («Chromatophore»
é uma impressionante e inesperada excepção, com 35) e, como leigos que
somos nesta área do conhecimento, sem elas aumenta a probabilidade de
assimilar como verdades científicas afirmações discutíveis ou
insuficientemente comprovadas. Podemos contudo dar como seguro que o
estilo de escrita da versão inglesa é por regra mais limpo, procurando com
frequência conciliar a exactidão dos termos com a clareza que pede um
público não especializado. Uma comparação das primeiras frases
(aproximadamente 100 palavras) das entradas «Tyndall effect» e «Efeito Tyndall» permite dar conta dessa diferença estilística22, justificável em
parte pelo número de edições (54 no primeiro caso, 6 no segundo):
The term Tyndall effect is usually applied to the effect of light scattering on particles in colloid systems, such as suspensions or emulsions. It is named after the Irish scientist John Tyndall. The Tyndall effect is used to tell the difference between the different types of mixtures namely solution, colloid and suspension. For example, the Tyndall effect is noticeable when car headlamps are used in fog. The light with shorter wavelengths scatter better, thus the color of scattered light has a bluish tint. This is also the reason as to why the sky looks blue – the light from the sun is scattered and we see the blue light because it scatters better. |
O efeito Tyndall é uma técnica usada para identificar uma dispersão coloidal. O efeito Tyndall foi descoberto em 1868, por John Tyndall, que em uma de suas experiências, percebeu o espalhamento de um feixe de luz em um meio contendo partículas em suspensão, Tyndall observou que uma sala cheia de fumaça ou poeira, tornava visível um feixe de luz que entrasse pela janela. As partículas que compõem os sistemas coloidais são muito pequenas para serem identificadas a olho nu, mas o seu tamanho é quase igual ao do comprimento de onda da luz visível. Por isso, uma luz que atravesse um sistema coloidal irá ser refletida pelas partículas. |
Não há contudo enciclopédias perfeitas, como já foi
argumentado acima. Um conceito que ocorre com bastante frequência em Seven
Deadly Colours é o de «cor estrutural» — uma forma de «selecção»23 de
frequências luminosas em que se prescinde do recurso a pigmentos,
resultando em vez disso dum efeito de difracção originado pela própria
estrutura microscópica de alguns materiais (como é o caso das escamas das
asas de algumas borboletas) –, mas nenhuma das versões em apreço possui
uma entrada com esse intitulado. Na versão portuguesa falhou a nossa busca
a qualquer referência similar: o conceito não surge em «Cor» nem em
qualquer outra entrada relacionada. Mas o caso mais digno de nota ocorre
com a versão inglesa. «Structural color» redirecciona automaticamente para
«Color», onde o termo está reduzido a uma secção com cerca de meio ecrã de
extensão; a definição aí presente é concisa (e clara, na nossa opinião),
terminando com um esclarecimento que serve também de advertência: «A
layman’s term that describes particularly the most ordered structural
colors is iridescence.» Ora, ao clicar no link respectivo e entrando em «Iridescence»,
damos com uma definição de quatro parágrafos (e três belas ilustrações:
uma borboleta, uma bolha de sabão e um fóssil duma concha de molusco com
reflexos metálicos) da qual está ausente o termo «structural color». Em
poucas palavras, o «layman’s term» prevalece sobre o conceito que deveria
contê-lo como caso particular.
Pelos factos (comprováveis) de haver muito mais
contribuições e contribuidores na língua inglesa e de esta ser a língua
franca na comunidade científica, pelo (hipotético) de esta congregar
também um maior número de especialistas — e presumivelmente mais activos
— nas respectivas áreas, e ainda pela vantagem temporal (mesmo que a
versão portuguesa só conte com alguns meses de atraso e seja actualmente a
oitava em número de artigos24), é compreensível que a versão lusófona não
esteja ainda à altura da sua «parente mais velha». Há sem dúvida casos em
que a dimensão mais reduzida (quer em número de entradas quer na sua
extensão) poderia constituir uma vantagem. Pensamos nomeadamente na grande
quantidade de trivial knowledge (listas de episódios de séries televisivas
ou tantos outros elementos da cultura de massas cuja presença numa
enciclopédia deste tipo é discutível — mesmo que a nossa opinião não seja
de todo desfavorável à sua inclusão, poderiam constituir um projecto
paralelo), mas como esta all-inclusiveness já se disseminou à edição
portuguesa tal tipo de apologia deixa de ter sentido<a href="#Nota26" title="Cf. a categoria «25.
A discrepância nas extensões poderia também marcar a
diferença entre uma entrada (em português) destinada a leitores que não
procuram um grande grau de profundidade e uma outra (em inglês) onde essa
profundidade está à sua disposição26. Por enquanto, contudo, a preferência
recai indubitavelmente sobre a versão «original», faltando os argumentos
que façam recomendar a de língua portuguesa27. O que é um revés para o tão
propagado princípio do «Neutral Point of View»: enquanto uma língua
periférica (e, ainda assim, a sexta mais falada no mundo) estiver limitada
a versões handicapped da Wikipedia, também a expressão «Sociedade do
Conhecimento» continuará a ser uma intenção por concretizar.
Bibliografia:
2006 «Fatally
Flawed: Refuting the Recent Study on Encyclopedic Accuracy by the Journal
Nature», memorando público, Março de 2006, última consulta a 13
de Novembro de 2006.
2005a «Internet
Encyclopaedias go Head to Head», Nature, n.º 438, 15 de
Dezembro de 2005, pp. 900-901, última consulta a 13 de Novembro de 2006.
2005b «Supplementary
Information to Accompany Nature News Article “Internet Encyclopaedias go
Head to Head”», 22 de Dezembro de 2005, última consulta a 13 de
Novembro de 2006.
2006 «Analyzing
and Visualizing the Semantic Coverage of Wikipedia and its Authors»,
artigo submetido à revista Complexity, última consulta a 13 de
Novembro de 2006.
1997 Connected Intelligence: The
Arrival of the Web Society, ed. port. Inteligência Conectiva: A
Emergência da Cibersociedade, Lisboa, Fundação para a Divulgação das
Tecnologias da Informação, 1998.
2000 Code and Other Laws of
Cyberspace, Nova Iorque, Basic Books.
1997a L’intelligence collective:
Pour une anthropologie du cyberspace, Paris, La Découverte.
1997b Cyberculture, ed. port.
Cibercultura, Lisboa, Instituto Piaget, 2000.
2004a «Wikipedia
as Participatory Journalism: Reliable Sources? Metrics for evaluating
Collaborative Media as a News Resource», comunicação apresentada ao 5th
International Symposium on Online Journalism, University of Texas at
Austin, 16 e 17 de Abril de 2004, última consulta a 13 de Novembro de
2006.
2004b «Participatory
Journalism and Asia: From Web Logs to Wikipedia», comunicação
apresentada à 13th Asian Media Information & Communications
Centre Annual Conference, 1 a 3 de Julho de 2004, última consulta a 13 de
Novembro de 2006.
2002 «Redes e Imitação», Revista
de Comunicação e Linguagens, n.º extra («A Cultura das Redes»), Lisboa,
Relógio d’Água, pp. 92-114.
2005 «Do Espaço da Física Clássica
ao Espaço das Redes», Revista de Comunicação e Linguagens, n.º
34-35 («Espaços»), Lisboa, Relógio d’Água, pp. 81-99.
2006a «Encyclopaedia
Britannica and Nature: A Response», Março de 2006, última
consulta a 13 de Novembro de 2006.
2006b
Editorial sem título, Março de 2006, última consulta a 13 de Novembro
de 2006.
2005 Seven Deadly Colours,
Londres, The Free Press/Simon & Schuster, 2006.
Notas:
1 Excepto se convenientemente oculta em notas de fim de
texto.
2 Eis uma dessas referências livrescas invocadas na
nota anterior: para a indissolúvel relação entre dois dos significados de
«código» quando entramos no domínio das redes de comunicação — código
enquanto lei e código enquanto linguagem de programação –, cf. a obra de
Lawrence Lessig, em particular Code and other Laws of Cyberspace (Lessig,
2000) com uma versão 2.0 prestes a sair no momento em que se escrevem
estas linhas.
3 Note-se quão difícil é evitar um vocabulário
topológico, apesar da alegada acentralidade da web.
4 Por exemplo, o domain name associado a um
site. Cf. o caso do cantor Bruce Springsteen, cujo site oficial
possui a extensão .net pelo facto de
www.brucespringsteen.com ter
sido previamente registado (juntamente com outros domínios similares) pelo
cybersquatter Jeff Burgar, sendo ainda hoje «The Unauthorized Bruce
Springsteen Web Site» apesar de não ser actualizado desde 2001. Também já
não é possível encontrar online rasto das notícias desse caso, mas as
actividades de Jeff Burgar continuam a ser ocasionalmente referidas, como
na recente derrota na disputa legal pelo domínio
www.tomcruise.com (cf.
http://www.eonline.com/News/Items/0,1,19580,00.html).
5 É já bastante significativa a quantidade de projectos
de investigação, a nível internacional, que procura mapear a World Wide
Web. Um (sempre provisório) mapeamento do domínio .pt foi efectuado no
projecto «Tendências da Cultura das Redes em Portugal», realizado pelo
Centro de Estudos de Comunicação e Linguagens. Confirmaram-se, a nível
local, algumas características globais da WWW, como é o caso da
distribuição de links pelas páginas segundo uma lei de potência,
configuração que parece confirmar o efeito «rich get richer» (cf.
Machuco Rosa, 2005, em especial as pp. 91-93).
6 Feliz acaso da língua portuguesa, «demand» e «search»
são cobertos por uma mesma palavra: «procura».
7 Servimo-nos aqui do título de uma das novelas
mainstream de Philip K. Dick, Confessions of a Crap Artist,
cujo protagonista é justamente um desses colectores de «factos» e teorias
quase sempre pseudocientíficos dada a sua incapacidade de destrinçar entre
o comprovado, o plausível e o fabuloso.
8 Num artigo com estas características, não encontramos
melhor forma de confirmar (ou desmentir) a nossa argumentação que não seja
o recurso à própria Wikipedia como fonte. Para evitar contudo que a
bibliografia supere em tamanho o próprio corpo do texto, não damos conta,
excepto nos casos em que tal se justifique, das entradas consultadas, e
muito menos da respectiva URL, que pode ser encontrada através de uma
simples busca nas páginas de entrada da Wikipedia inglesa (http://en.wikipedia.org/)
e da portuguesa (http://pt.wikipedia.org/).
9 Estamos de novo a simplificar, aglutinando alguns dos
sete passos necessários (cf.
http://en.wikipedia.org/wiki/Nupedia#The_editorial_process).
10 Não havendo aqui espaço para explicar em pormenor o
que é um wiki, remetemos para a respectiva entrada na Wikipedia,
em
http://en.wikipedia.org/wiki/Wiki. No que respeita ao género
gramatical — «o» wiki ou «a» wiki –, as entradas correspondentes
das línguas de origem latina mais comuns (espanhol, francês, português e
italiano) referem-se-lhe como sendo uma palavra masculina, e é essa a
opção aqui seguida.
11 Ainda hoje em funcionamento, em
http://c2.com/cgi/wiki?FrontPage.
12 A ressalva pretende contemplar diversíssimos casos,
como o dos wikis privados, em que, no limite, até a consulta exige
que o utilizador seja «certificado», e situações — ocasionais na própria
Wikipedia — de «páginas congeladas» ou de edição restrita a alguns
utilizadores credenciados como agindo de boa-fé.
13 Até 5 de Dezembro de 2005, poder-se-ia ter dito
«livre criação e edição de artigos». Devido a um polémico caso que
envolvia uma alegação de que o jornalista John Seigenthaler, Sr. (numa
entrada com o seu nome em
http://en.wikipedia.org/wiki/John_Seigenthaler_Sr.) teria sido um dos
suspeitos nos assassinatos dos Kennedy, a criação de artigos passou a ser
restrita a utilizadores registados; a edição, contudo, continua a poder
ser feita tanto por estes (que possuem um username) quanto pelos
anónimos (caso em que fica apenas registado o IP a partir do qual deram o
seu contributo).
14 A própria Wikipedia apresenta-as de diversas
formas: há os «Five pillars of Wikipedia» («Wikipedia is an encyclopedia»,
«Wikipedia has a neutral point of view», «Wikipedia is free content», «Wikipedia
has a code of conduct» e o só aparentemente autocontraditório «Wikipedia
does not have firm rules»), cada um subdividindo-se em recomendações mais
detalhadas; o «Simplified ruleset», que consiste em dezasseis «regras de
ouro» para o potencial autor, e uma lista com as quarenta e duas «policies»
oficiais e modos de salvaguardá-las.
15 Também interessante, mas menos relevante para os
nossos propósitos, é o artigo «Participatory Journalism and Asia: From Web
Logs to Wikipedia» (Lih, 2004b), cujo foco se restringe aos países
asiáticos.
16 Conservando o mesmo exemplo, entre 6 e 25 de Abril
de 2004 (já algumas semanas passadas sobre os atentados), a entrada «11_March_2004_Madrid_attacks»
mantinha uma média de 8789 alterações diárias (cf. Lih, 2004a, p. 17).
17 O autor invoca a necessidade de uma metodologia mais
aprofundada do que a que utilizou para que possa ser possível distinguir
entre contribuições «positivas» e vandalizações. Segundo afirma, «Detecting
vandalism can be done heuristically, since most Wikipedia regulars will
mark vandalism or non-useful edits with a comment such as “Reverting…” or
“rv” to indicate the elimination of unwanted content» (Lih, 2004a, p. 20),
mas essa condição nem sempre se verifica. Na metodologia que utilizou,
todos os contributos, incluído as vandalizações, são contabilizados
enquanto tal.
18 Por questões de espaço, simplificamos os passos
metodológicos seguidos. Remetemos para Giles, 2005b para uma descrição
mais detalhada.
19 A recolha final de dados foi feita no dia 13 de
Novembro de 2006, não sendo tidas em conta eventuais alterações
posteriores.
20 Em fase de tradução, e portanto parcialmente em
língua inglesa.
21 Não há uniformidade quanto à diferença entre as
verdadeiras referências bibliográficas (i. e., a livros ou artigos, mesmo
que em versão online) e as meras referências externas (i. e.,
links sugeridos). Ainda que fosse aconselhável, numa análise mais
profunda, tomar ambas e num momento posterior fazer a diferenciação
segundo algum tipo de critério, optámos por apenas contabilizar as
referências bibliográficas sob a secção do artigo assim intitulada.
22 Note-se, por exemplo, como no primeiro caso se
procura definir o fenómeno físico que recebeu esse nome para só depois
assinalar uma das suas aplicações práticas, enquanto o segundo começa pela
técnica para só depois explicar o efeito. Vale à versão portuguesa o facto
de mencionar o ano em que o efeito foi descoberto, ainda que não haja
qualquer referência à nacionalidade de John Tyndall.
23 Perdoe-se o termo algo desajeitado, mas necessário
para evitar o uso de «reflexão», que só seria estritamente adequado no
caso dos pigmentos.
24 Ainda assim, oito vezes menos do que a congénere
inglesa (um pouco menos de duzentos mil artigos para quase um milhão e
meio).
25 Cf. a categoria «Telenovelas_da_Rede_Globo»,
assim como cada uma das muitas entradas para as quais ela aponta.
26 Apesar do objectivo algo distinto, está actualmente
em curso um novo spin-off da Wikipedia, uma versão em «Simple
English» destinada a crianças e a iniciados no inglês como língua
estrangeira (cf.
http://simple.wikipedia.org/wiki/Main_Page). Conta, à data em que
escrevemos, com cerca de doze mil artigos, o que corresponde a um
significativo 48.º lugar num ranking de número de artigos.
27 Não o discutimos neste artigo, mas a nossa
experiência leva a reforçar a recomendação assim que se entra no domínio
das ciências sociais e humanas, onde as discrepâncias se tornam ainda mais
gritantes.
© Jorge Martins
Rosa
Ao abrigo de uma licença
Creative Commons Attribution-Noncommercial-No Derivative Works 2.5 (Portugal).
<!–
–>
TinyURL:
http://tinyurl.com/2srwrb/wishful.html
Texto: 22/Nov/06
Actualização: 13/Mar/08