O que é este blog?

Este blog trata basicamente de ideias, se possível inteligentes, para pessoas inteligentes. Ele também se ocupa de ideias aplicadas à política, em especial à política econômica. Ele constitui uma tentativa de manter um pensamento crítico e independente sobre livros, sobre questões culturais em geral, focando numa discussão bem informada sobre temas de relações internacionais e de política externa do Brasil. Para meus livros e ensaios ver o website: www.pralmeida.org. Para a maior parte de meus textos, ver minha página na plataforma Academia.edu, link: https://itamaraty.academia.edu/PauloRobertodeAlmeida;

Meu Twitter: https://twitter.com/PauloAlmeida53

Facebook: https://www.facebook.com/paulobooks

Mostrando postagens com marcador Google. Mostrar todas as postagens
Mostrando postagens com marcador Google. Mostrar todas as postagens

segunda-feira, 18 de junho de 2012

PRA: RIP

Ainda tenho de esclarecer a minha morte. Espero que a polícia possa colaborar...
O Google, por vezes, nos dá mais trabalho do que o imaginado...



Jornal Cruzeiro do Sul
Outra morte a ser desvendada é a de Paulo Roberto de Almeida, baleado num campo de futebol do Jardim Betânia em 15 de fevereiro.

quinta-feira, 24 de maio de 2012

Progressos da educacao na googlelizacao - novos instrumentos

Durante muito tempo, nos acostumamos a identificar o Google com "cópia" na internet para um rápido trabalhinho escolar, tanto que se popularizou o termo, ou o verbo, "to google", ou seja, "googlelizar", significando, habitualmente o copy and paste dos alunos preguiçosos.
Mas todo vício vem com a sua cura, ao que parece. O Google desenvolveu inúmeras ferramentas para ajudar nos trabalhos sérios, inclusive com instrumentos de busca e seleção de materiais que podem ajudar os professores a aperfeiçoarem suas aulas.
Agradeço à educadora Juliana por ter-me chamado a atenção para esta matéria, em seu blog.
Paulo Roberto de Almeida 

Search Education, o novo site de pesquisas educacionais do Google

Do Estadão:

Se você digita uma palavra no Google, em menos de um segundo o buscador vai apresentar alguns milhares de resultados que mencionam o termo. Alguns deles, de fato, podem ajudar muito na sua busca; outros, nem tanto. Para ensinar estudantes e professores a separar o joio do trigo e ajudá-los a fazer pesquisas mais qualificadas, o Google lançou, este mês, o site Search Education (www.google.com/insidesearch/searcheducation). Ainda completamente em inglês, o site é voltado a professores interessados em ensinar estratégias de pesquisa a seus alunos ou a usuários que querem otimizar suas buscas. 

“Nós decidimos ensinar a pesquisar porque o Google tem uma gama de ferramentas, mas a maioria das pessoas só conhece parte delas”, diz Tasha Bergsin-Michelson, educadora do Google. Uma das seções do site é a Lessons Plans, ou planos de aula, em português. Nela, é possível encontrar os tutorias em três níveis de dificuldade que ensinam educadores com mais ou menos intimidade com o Google a pesquisar. Os vídeos dão dicas de como escolher os termos de pesquisa mais adequados, entender o resultado da busca, restringir a pesquisa para chegar a melhores resultados e até avaliar a credibilidade da fonte de informação.

A estratégia do Google de falar aos professores tem como objetivo fazer o treinamento chegar aos alunos para torná-los capazes de aprender sozinhos e de ser bons questionadores. “Nós precisamos cultivar a autonomia da aprendizagem nos nossos estudantes, para que, quando eles saírem para o mundo, depois do ensino médio, na faculdade, na carreira ou na vida, eles saibam como pesquisar e pensar criticamente”, diz Anne Arriaga, bibliotecária e membro da equipe de educadores do Google. No Search Education, os professores encontram também uma série de sugestões para desafiar os alunos. Dividido por disciplinas como história, geografia, biologia, o Google Day Challenge propõe atividades em que os estudantes serão testados tanto no conhecimento da matéria quanto nas ferramentas do buscador. Pelo site, o professor recebe dicas de como conduzir o exercício.

As atividades específicas foram desenvolvidas a partir do currículo norte-americano e, por enquanto, não há previsão de que a ferramenta seja traduzida ou adaptada para o ensino brasileiro. Para os vídeos gerais, que falam sobre as funcionalidades do Google, no entanto, as dicas podem ser muito úteis. O único problema é que todos os tutoriais são em inglês. Quem não domina o idioma, porém, pode recorrer à ajuda do próprio Google para decifrá-los. Ao clicar no botão CC, na parte inferior da tela, é possível selecionar a opção de ter a transcrição do áudio. Com o áudio transcrito, é só jogar o texto para ser traduzido pelo Google Tradutor.

segunda-feira, 19 de dezembro de 2011

Apple: defendendo o monopolio, prejudicando a concorrencia

A despeito de só ter usado computadores Apple -- de todos os tipos e linhas -- desde o meu primeiro MacIntosh Plus, e de usar correntemente um MacAir, um iPad e dois iPhones, sou contrário a esta caso da Apple, que só tende a reforçar o monopólio, diminuir a concorrência e deixar todos pobres, com a extração de renda compulsória pela Apple e o não desenvolvimento de seus sistemas em plataformas concorrentes.
Paulo Roberto de Almeida 



Apple Wins Partial Victory on Patent Claim Over Android Features

A federal agency ruled on Monday that a set of important features commonly found in smartphones are protected by an Apple patent, a decision that could force changes in the way Google’s Android phones function.

The ruling, by the United States International Trade Commission, can be appealed. But it is one of the most significant so far in a growing array of closely watched patent battles being waged around the globe by nearly all of the major players in the mobile industry.

The ruling was only a partial victory for Apple because the commission overruled an earlier decision in Apple’s favor in the case, involving a patent related to how software is organized internally on mobile devices. It would have been harder for the defendant in the case — HTC, one of the world’s largest makers of smartphones that run the Android system — to adapt its devices to avoid infringing that patent, legal experts said.

Read More:

segunda-feira, 18 de julho de 2011

Google: mais capitalista em Ingles do que em Portugues...

Não é culpa do Google, obviamente, pois ele apenas reflete o que mais é demandado e clicado na internet, mas também reproduz o que é mais produzido sob os conceitos selecionados.

Uma pequena pesquisa sobre "falhas", de governo e/ou de mercado, revelou estes resultados:

Google Search:

Market failures: Aproximadamente 82.600.000 resultados (0,38 segundos)

Government failures: Aproximadamente 126.000.000 resultados (0,18 segundos)

Falhas de mercado: Aproximadamente 3.530.000 resultados (0,19 segundos)

Falhas de governo: Aproximadamente 3.650.000 resultados (0,16 segundos)

Ou seja, as falhas de governo, ou consideradas como tais, são muito mais numerosas em inglês, do que em Português.
Parece que em nosso país o governo erra menos, do que nesses países anglossaxões, que devem ser uma verdadeira bagunça, a crer nesses números...

Ainda bem: imaginem como a nossa vida seria um inferno se o governo aqui errasse mais.
Está bem assim, fiquemos com esse modéstia de resultados nas falhas de governo...

Paulo Roberto de Almeida

quinta-feira, 23 de junho de 2011

O imperio Google e os livros britanicos e franceses: duas mentalidades

Lembro-me bem que, alguns anos atrás, a Google propôs a várias bibliotecas europeias digitalizar DE GRAÇA todos os livros antigos de livre acesso (ou seja, sem copyright de autor vivo ou de descendentes rentistas).
Várias aceitaram, mas os franceses logo montaram num cavalo e sairam pela Europa combatendo a "sugestão inaceitável" da corporação americana: "Imaginem o que esses gigantes americanos que só visam lucro não iriam fazer com os 'nossos' livros??!! Vender, se aproveitar, lucrar em cima de nossa bela cultura e nossa magnífica literatura...".
Enfim, poupo vocês dos detalhes (isso ainda na era Jacques Chirac). Eles então montaram um grandioso projeto europeu, financiado, claro, com dinheiro dos cidadãos, e até hoje devem ter digitalizado 10% do que a Google se comprometia a fazer inteiramente de graça, e colocaria à disposição de qualquer hottentote ou bushman das selvas (não confundir com a tribo texana dos Bush), apenas com uma ou outra propaganda nas margens (este é o preço do capitalismo).
Bem, isto apenas para dizer que a British Library aceitou a oferta da Google e vai colocar seu acervo à disposição dos simples mortais que somos nós.
Quanto aos franceses, ora, o que dizer? Vamos esperar mais alguns anos...
Lá vou eu downloadar (ugh!) o programa da British Library no meu iPad...
Paulo Roberto de Almeida

La British Library signe avec Google
Le Magazine Littéraire, 20/06/2011

Après l’annonce du lancement de son application pour Ipad – qui donnera un accès gratuit à plus de 1000 classiques anglais du XIXe, et un accès payant à plus de 60 000 titres – la British Library (pendant britannique de notre BnF) vient de conclure un partenariat avec l’entreprise Google pour numériser 250000 livres publiés entre 1700 et 1870.

Les titres seront accessibles via le site de la British Library, et celui de Google Books. Notons que l’entreprise Google prendra tous les frais de numérisation à sa charge. Selon Danne Lynne Brindley, Président de la British Library : «Au XIXe siècle, nos prédécesseurs avaient l’ambition de donner, à tout le monde, l’accès au plus d’informations possible, afin que la connaissance ne soit pas seulement réservée à ceux qui pouvaient se permettre de constituer des bibliothèques personnelles. Leur façon de procéder était d’acheter des livres du monde entier, et de les rendre disponibles dans des salles de lectures publiques. Notre partenariat avec Google nous ravit, car nous pensons qu’à travers lui, nous poursuivons cette tradition, dont nous sommes fiers, en offrant accès à ce matériau historique à chacun, où qu’il soit.» Rappelons qu’un semblable projet de partenariat entre Google et la BnF avait été reporté après avoir déclenché une vive polémique.

quinta-feira, 17 de fevereiro de 2011

Google e censura no Brasil: uma retificação importante

Agradeço ao leitor e comentarista Fernando Marés de Souza, responsável por um excelente blog chamado Roteiro de Cinema News, pela retificação importante e qualificação necessária, que fez em relação a este meu post:

Google: minha solidariedade, meu protesto contra a censura (16/02/2011)

Abaixo, seu post que desmente as informações alarmistas, e recomendo sua leitura na fonte, por inteiro, com gráficos, tabelas e quadros reproduzindo as principais matérias a respeito.

Só posso chegar a uma conclusão evidente: não podemos mais confiar sequer nos grandes jornais para uma informação correta sobre questões importantes.
Ceticismo sadio, portanto.
Paulo Roberto de Almeida

A VERDADE SOBRE O GOOGLE E A SUPOSTA CENSURA DE NOTÍCIAS NO BRASIL
Roteiro de Cinema News - Fernando Marés de Souza
quarta-feira, 16 de fevereiro de 2011

O Estado de São Paulo, a Veja, incluindo o blog do Reinaldo Azevedo, e a Exame noticiaram hoje que o Brasil “é recordista de notícias censuradas no Google”, que o "Google foi obrigado por autoridades brasileiras a tirar do ar 398 textos jornalísticos". Os veículos apresentam como fato que "398 matérias" foram deletadas dos servidores Google por ordem das “autoridades”. Seria um fato escandaloso se fosse verdade, mas não é.

Por motivos que não compreendo, os grandes veículos de imprensa online não “linkam” suas fontes, não permitem que o leitor vá direto ao dado original para checar por si mesmo e para que possa interpretá-lo e inclusive levar adiante novas abordagens, como é o costume entre blogueiros independentes. Porém, fazendo uma pesquisa rápida, um "fact-check" de rotina, facilmente se descobre que o “fato” noticiado pelos três veículos - e por mais de cinqüenta outros veículos que foram na onda dos três - não é verdadeiro.

UPDATE: Depois de ler as informações publicadas aqui, o jornalista Gabriel Manzano corrigiu parcialmente a informação equivocada do Estadão sobre Google e suposta Censura de Notícias no Brasil. Veja, Reinaldo e Exame ainda não. Mesmo corrigindo a matéria, creio que não tenha sido eficiente. Notas ao final.

UPDATE 2: O jornalismo brazuca online, do "gillette press", do "ctrl C + ctrl V", das "matérias kibadas", foi todo na onda do Manzano e os veículos publicando desinformação e fatos não verdadeiros sobre "notícias censuradas no google" já se pode contar às dezenas, no mínimo 59, incluindo G1, UOL, Zero Hora, Portal Imprensa - clientes da Agência Estado - Coletiva Net, Folha de Ibitinga, Rio News, Comunique-se, entre outras, procure no Google News "censura + google".

UPDATE 3: Veja não reconhece publicamente que disseminou informação não verdadeira mas altera texto para versão mais próxima ao texto revisado do Estadão. Considero falta de ética da Editora Abril não publicar nota de esclarecimento sobre as informações equivocadas que publicou no site durante horas e lançou no Twitter, mensagem que foi retuitada por centenas de pessoas, como documentado nesta matéria.

O dado reportado é supostamente baseado em relatório elaborado pelo argentino Carlos Lauria, do Committee to Protect Journalists - que não fala em 398 "matérias jornalísticas", e sim "content" - informação que por sua vez é baseada em relatório do próprio Google, que pode ser facilmente acessada e “linkada” pela URL: http://www.google.com/transparencyreport/governmentrequests/?p=2010-06&r=BR&t=DETAIL

Pois bem, abaixo está o screenshot do relatório. Segundo os dados publicados pelo Google nenhuma “notícia” ou "matéria" foi censurada ou retirada do site (Google News = 0), o número expressivo de 398 pedidos de remoção de conteúdo dos servidores Google é formado por páginas do Orkut (99 pedidos de remoção por ordens judiciais e 220 extra judiciais, num total de 319), vídeos do Youtube (47 pedidos no total), fotos do Picasa (1 pedido), etc. As remoções são baseadas na legislação brasileira de direito de propriedade intelectual, de privacidade e/ou de personalidade. Nada tem a ver com censura, como bradam os jornalistas desinformados.

(ler a integra neste link)

quarta-feira, 16 de fevereiro de 2011

Google: minha solidariedade, meu protesto contra a censura

A Google não precisa da minha solidariedade, claro, mas eu gostaria que existisse um instrumento constitucional que viabilizasse que essa companhia pudesse processar um juiz, e puni-lo pecuniariamente, frente a um Conselho de Justiça credível, por exemplo (não essa associação entre amigos que existe atualmente), cada vez que um desses censores togados violasse a Constituição proibindo a divulgação de notícias verdadeiras (não boatos).
Paulo Roberto de Almeida

Brasil bate recorde de censura ao Google
Gabriel Manzano
Estado de S.Paulo, 16/02/2011

Só na primeira metade do ano passado, o Google foi obrigado por autoridades brasileiras a tirar do ar 398 textos jornalísticos. Foi recorde mundial do período. O dobro do segundo da lista, a Líbia. O dado está no relatório do Comitê para a Proteção dos Jornalistas (CPJ), divulgado ontem em São Paulo.

Além disso, nos dias finais da corrida eleitoral brasileira os juízes do País emitiram 21 ordens de censura, revela uma pesquisa do Centro Knight para o Jornalismo, do Texas (EUA). Muitas agências de notícias foram também multadas ou tiveram de remover conteúdos. “Esse quadro mostra que a censura e a autocensura, que vem junto, estão atingindo níveis muito sérios no Brasil”, resumiu Carlos Lauria, coordenador do CPJ, que veio ao Brasil apresentar o levantamento Ataques à Imprensa em 2010. Ele distribuiu ainda outro texto menor sobre a situação na América Latina, em encontro promovido pela Associação Brasileira de Jornalismo Investigativo (Abraji). “Nossos levantamentos apontam 44 jornalistas mortos em serviço e 145 presos, em todo o mundo, no ano passado”, resumiu.

A censura ao Estado, hoje em seu 565.º dia, é o destaque de abertura do levantamento sobre o continente. “É espantoso que, num país como o Brasil, um dos maiores jornais seja proibido de noticiar um grande escândalo, que envolve figuras políticas conhecidas. Não consigo imaginar o The Washington Post sendo proibido de publicar algo sobre um ex-presidente americano”, disse ele. Lauria vai a Brasília amanhã, onde se reunirá com autoridades do Planalto, da Secretaria das Comunicações e dos Direitos Humanos. A agenda inclui uma visita ao Supremo Tribunal Federal.

Artifício. Os levantamentos do comitê, nos cinco continentes, apontam um novo artifício dos governos para impedir o trabalho da imprensa: eles enquadram os jornalistas em crimes de outra ordem, como subversão ou atos contra o interesse nacional, nos quais as leis sobre imprensa não se aplicam. Isso tem ocorrido no Oriente Médio, no Casaquistão, na África.

sábado, 5 de fevereiro de 2011

Google: instrumento de pesquisa refinada

Eu já tinha postado esta mesma matéria aqui, pouco tempo atrás, neste link, mas pela relevância do instrumento de busca, creio que vale a pena postar de novo.

Vejam este novo soft da Google: http://ngrams.googlelabs.com/

Acabo de colocar, como teste, "economic development" e os resultados estão aqui: http://ngrams.googlelabs.com/graph?content=economic+development&year_start=1800&year_end=2000&corpus=0&smoothing=3

Word-Wide Web Launches
New Google Database Puts Centuries of Cultural Trends in Reach of Linguists
By ROBERT LEE HOTZ
The Wall Street Journal, December 17, 2010

(ver as imagens neste link)

Language analysts, sifting through two centuries of words in the millions of books in Google Inc.'s growing digital library, found a new way to track the arc of fame, the effect of censorship, the spread of inventions and the explosive growth of new terms in the English-speaking world.

A new report reveals how researchers are using Google's immense digital library to track cultural trends and catalogue human culture over the last 200 years. WSJ's Robert Lee Hotz discusses the cutting edge endeavor with WSJDN's Kelsey Hubbard.

In research reported Thursday in the journal Science, the scientists at Harvard University, Massachusetts Institute of Technology, Google and the Encyclopedia Britannica unveiled a database of two billion words and phrases drawn from 5.2 million books in Google's digital library published during the past 200 years. With this tool, researchers can measure trends through the language authors used and the names of people they mentioned.

It's the first time scholars have used Google's controversial trove of digital books for academic research, and the result was opened to the public online Thursday.

Analyzing the computerized text, the researchers reported that they could measure the hardening rhetoric of nations facing off for war, by tracking increasing use of the word "enemy." They also could track changing tastes in food, noting the waning appetite for sausage, which peaks in the 1940s, and the advent of sushi, the mentions of which start to soar in the 1980s. They documented the decline of the word "God" in the modern era, which falls sharply from its peak in the 1840s.

"We can see patterns in space, time and cultural context, on a scale a million times greater than in the past," said Mark Liberman, a computational linguist at the University of Pennsylvania, who wasn't involved in the project. "Everywhere you focus these new instruments, you see interesting patterns."

The digital text also captured the evolving structure of a living language, and almost a half-million English words that have appeared since 1950, partly reflecting the growing number of technical terms, such as buckyball, netiquette and phytonutrient.

"It is just stunning," said noted cultural historian Robert Darnton, director of the Harvard University Library, who wasn't involved in the project and who has been critical of Google's effort to digitize the world's books. "They've come up with something that is going to make an enormous difference in our understanding of history and literature."

All told, about 129 million books have been published since the invention of the printing press. In 2004, Google software engineers began making electronic copies of them, and have about 15 million so far, comprising more than two trillion words in 400 languages.

"We realized we were sitting on this huge trove of data," said Google Books engineering manager Jon Orwant. "We want to let researchers slice and dice the data in ways that allow them to ask questions they could not ask before."

The online library project has been hobbled by lawsuits, copyright disputes and fears over the potential for the company to have an information monopoly. "There have been computational hurdles, scientific hurdles, organizational and legal hurdles," said mathematician Erez Lieberman Aiden at the Harvard Society of Fellows, who helped create the database.

To avoid copyright violations, the scientists are making available the vast catalog of frequency patterns of words and phrases, not the raw text of books. Google Labs posted freely downloadable data sets and a special viewer at http://ngrams.googlelabs.com Thursday. These data sets consist of short phrases—up to five words —with counts of how often they occurred in each year.

Journal Community - DISCUSS
What an amazing tool for analyzing culture! Understanding ourselves better could be a tremendously postive development. The dark sides though, are the opportunities for molding thought patterns en masse and social engineering that such an understanding presents. Onward ho! May we be able to preserve original thought and free will.
—Vincent P. Emmer
They currently include Chinese, English, French, German, Russian and Spanish books dating back to the year 1500—about 4% of all books published. The database doesn't include periodicals, which might reflect popular culture from a different vantage.

By calculating how frequently famous personalities appear in Google's digitized texts, the Harvard researchers discovered that people these days become famous at a younger age than in previous eras and reach unprecedented peaks of notoriety. "The flip side is that people forget about you faster," said Harvard lead researcher J.B. Michel.

Measuring occurrences of prominent names, Mr. Michel and his colleagues found that Jimmy Carter leapt from obscurity around 1974, at the onset of his run for the U.S. presidency, to overtake Mickey Mouse, Marilyn Monroe and astronaut Neil Armstrong in published mentions. Once out of office, Mr. Carter began an equally sharp decline in mention. By contrast, the cartoon character, the astronaut and the movie star have continued their steady rise up the slope of fame.

In the same way, they identified instances of censorship by charting the abrupt disappearance of controversial figures from the written record.

Mentions of the popular Jewish artist Marc Chagall, for example, virtually disappear from German literature during the era of Nazi power between 1936 and 1944, when his work was banned, but not from English books of the same period.

Other scholars are using the new database to chart social and emotional concepts over the past 200 years.

"Empathy has shot up since the 1940s," said Harvard University cognitive scientist and linguist Steven Pinker, who is experimenting with the data in his own research. "Will power, self-control and prudence have declined."

Write to Robert Lee Hotz at sciencejournal@wsj.com

Copyright 2010 Dow Jones & Company, Inc. All Rights Reserved

terça-feira, 21 de dezembro de 2010

New Google Database Puts Centuries of Cultural Trends in Reach of Linguists

Interessante essa busca do conhecimento universal por meio dos instrumentos de busca do tipo Google.
Nunca antes na história do mundo -- com perdão da paráfrase -- foi possível aceder ao conhecimento pleno dos conceitos mais utilizados pelas civilizações e sociedades com tal facilidade, graças às novas "enciclopédias do saber universal" do tipo Google.

Word-Wide Web Launches
New Google Database Puts Centuries of Cultural Trends in Reach of Linguists
By ROBERT LEE HOTZ
The Wall Street Journal, December 17, 2010

(ver as imagens neste link)

Language analysts, sifting through two centuries of words in the millions of books in Google Inc.'s growing digital library, found a new way to track the arc of fame, the effect of censorship, the spread of inventions and the explosive growth of new terms in the English-speaking world.

A new report reveals how researchers are using Google's immense digital library to track cultural trends and catalogue human culture over the last 200 years. WSJ's Robert Lee Hotz discusses the cutting edge endeavor with WSJDN's Kelsey Hubbard.

In research reported Thursday in the journal Science, the scientists at Harvard University, Massachusetts Institute of Technology, Google and the Encyclopedia Britannica unveiled a database of two billion words and phrases drawn from 5.2 million books in Google's digital library published during the past 200 years. With this tool, researchers can measure trends through the language authors used and the names of people they mentioned.

It's the first time scholars have used Google's controversial trove of digital books for academic research, and the result was opened to the public online Thursday.

Analyzing the computerized text, the researchers reported that they could measure the hardening rhetoric of nations facing off for war, by tracking increasing use of the word "enemy." They also could track changing tastes in food, noting the waning appetite for sausage, which peaks in the 1940s, and the advent of sushi, the mentions of which start to soar in the 1980s. They documented the decline of the word "God" in the modern era, which falls sharply from its peak in the 1840s.

"We can see patterns in space, time and cultural context, on a scale a million times greater than in the past," said Mark Liberman, a computational linguist at the University of Pennsylvania, who wasn't involved in the project. "Everywhere you focus these new instruments, you see interesting patterns."

The digital text also captured the evolving structure of a living language, and almost a half-million English words that have appeared since 1950, partly reflecting the growing number of technical terms, such as buckyball, netiquette and phytonutrient.

"It is just stunning," said noted cultural historian Robert Darnton, director of the Harvard University Library, who wasn't involved in the project and who has been critical of Google's effort to digitize the world's books. "They've come up with something that is going to make an enormous difference in our understanding of history and literature."

All told, about 129 million books have been published since the invention of the printing press. In 2004, Google software engineers began making electronic copies of them, and have about 15 million so far, comprising more than two trillion words in 400 languages.

"We realized we were sitting on this huge trove of data," said Google Books engineering manager Jon Orwant. "We want to let researchers slice and dice the data in ways that allow them to ask questions they could not ask before."

The online library project has been hobbled by lawsuits, copyright disputes and fears over the potential for the company to have an information monopoly. "There have been computational hurdles, scientific hurdles, organizational and legal hurdles," said mathematician Erez Lieberman Aiden at the Harvard Society of Fellows, who helped create the database.

To avoid copyright violations, the scientists are making available the vast catalog of frequency patterns of words and phrases, not the raw text of books. Google Labs posted freely downloadable data sets and a special viewer at http://ngrams.googlelabs.com Thursday. These data sets consist of short phrases—up to five words —with counts of how often they occurred in each year.

Journal Community - DISCUSS
What an amazing tool for analyzing culture! Understanding ourselves better could be a tremendously postive development. The dark sides though, are the opportunities for molding thought patterns en masse and social engineering that such an understanding presents. Onward ho! May we be able to preserve original thought and free will.
—Vincent P. Emmer
They currently include Chinese, English, French, German, Russian and Spanish books dating back to the year 1500—about 4% of all books published. The database doesn't include periodicals, which might reflect popular culture from a different vantage.

By calculating how frequently famous personalities appear in Google's digitized texts, the Harvard researchers discovered that people these days become famous at a younger age than in previous eras and reach unprecedented peaks of notoriety. "The flip side is that people forget about you faster," said Harvard lead researcher J.B. Michel.

Measuring occurrences of prominent names, Mr. Michel and his colleagues found that Jimmy Carter leapt from obscurity around 1974, at the onset of his run for the U.S. presidency, to overtake Mickey Mouse, Marilyn Monroe and astronaut Neil Armstrong in published mentions. Once out of office, Mr. Carter began an equally sharp decline in mention. By contrast, the cartoon character, the astronaut and the movie star have continued their steady rise up the slope of fame.

In the same way, they identified instances of censorship by charting the abrupt disappearance of controversial figures from the written record.

Mentions of the popular Jewish artist Marc Chagall, for example, virtually disappear from German literature during the era of Nazi power between 1936 and 1944, when his work was banned, but not from English books of the same period.

Other scholars are using the new database to chart social and emotional concepts over the past 200 years.

"Empathy has shot up since the 1940s," said Harvard University cognitive scientist and linguist Steven Pinker, who is experimenting with the data in his own research. "Will power, self-control and prudence have declined."

Write to Robert Lee Hotz at sciencejournal@wsj.com

Copyright 2010 Dow Jones & Company, Inc. All Rights Reserved

========

Teste com "economic development":


Google Labs Books Ngram Viewer

Graph these case-sensitive comma-separated phrases:
between and from the corpus with smoothing of .
0
Search in Google Books:
1800 - 19411942 - 19841985 - 19891990 - 19941995 - 2000economic development
Run your own experiment! Raw data is available for download here.

terça-feira, 28 de setembro de 2010

Big Brother e os dissidentes: Google to the rescue...

Nem tanto assim: o Google não vai fazer nada para ajudar dissidentes sob ditaduras ou Estados orwellianos.
Ele apenas vai mostrar quem está censurando o que, quando...
Apenas isso.
Já é alguma coisa: tirar os funcionários kafkianos da sombra e mostrar o que os seus chefes estão pedindo...
Paulo Roberto de Almeida

Googling the Censors
Editorial - New York Times
September 28, 2010, page A28

In most repressive countries, government censors like to toil in the shadows, maintaining a cover of deniability as they block citizens’ access to information. It is gratifying to see that the Internet and Google are making their job tougher.

Four months ago, Google unveiled a tool that allows users to monitor the requests received from governments to take down material or report data on the users of their search engine and other services. This month, it released another tool that will expose less overt attempts by governments to curtail its various services, including YouTube and Gmail.

The new tracker shows how traffic on YouTube in Iran fell to zero after the disputed presidential election last year. And how YouTube traffic collapsed in Libya in January after it aired videos of demonstrations by families of murdered prisoners and videos of partying relatives of Col. Muammar el-Qaddafi, the Libyan leader.

The tracker shows the ebbs and flows of traffic but not the cause of disruptions — whether a government directive or a cut cable. Still, it adds an important new source of information.

For starters, it suggests that repressive governments are most fearful of YouTube — an effective vehicle to disseminate dissenting views and evidence of government repression.

Google reports that the service has been blocked in at least 17 countries since 2007. China, for example, has blocked YouTube since March of last year after a video appeared on the site showing Chinese police beating Tibetans in Lhasa in 2008.

Once researchers start poring through the data, they will be able to track more precisely governments’ efforts to clamp down on information. Google officials say this could even deter censorship, perhaps by embarrassing authorities into changing their ways. That may be too optimistic. Even exposing where censorship is most rampant should be a victory for freedom of expression.

quarta-feira, 15 de setembro de 2010

Leituras: bem, agora ja sei o que me espera - alguns milhoes de livros

Eu realmente tinha algumas dúvidas sobre o quanto me esperava como leituras, quando eu puder descalçar os sapatos, deitar-me numa rede (com boa iluminação geral, mas sem muita luz de frente) e desfrutar de tempo inteiramente livre para leituras, meu prazer favorito (ops, talvez obsessivo).
Agora já não tenho mais: a Google acaba de satisfazer minha curiosidade: alguns milhões de livros, dezenas deles...
Agora só preciso calcular o tempo que levará para eu ler metade disso...
Paulo Roberto de Almeida

Mundo tem 130 milhões de livros, diz Google
Folha de S.Paulo, 10.08.2010 (Com agências internacionais)

Pesquisa calculou apenas obras impressas e encadernadas e excluiu diferentes versões de um mesmo volume
Relatórios, documentos de governo e mapas foram descartados; pesquisa relativizou base de dados do ISBN

Uma pesquisa realizada pelo Google na semana passada divulgou que há 129.864.880 de livros no mundo. A pesquisa teve como base o Google Books, projeto de digitalização de livros da empresa.
Para chegar ao número, o Google coletou informações com mais de 150 fontes do mundo, incluindo bibliotecas, livrarias, catálogos coletivos nacionais e provedores comerciais.
O primeiro resultado desta triagem apontou a existência de quase 600 milhões de volumes no mundo.
A segunda etapa da contagem tentou identificar as várias edições de um mesmo livro ou então obras que são lançadas por editoras diferentes, com nomes distintos.
Segundo a equipe da pesquisa, o livro "Programando em Perl, 3ª edição", por exemplo, tem 96 registros diferentes em 46 fornecedores. Outro caso é "At the Mountains of Madness and Other Tales of Terror", de H.P. Lovecraft, lançado nos EUA por duas editoras diferentes.
Após a nova apuração, a quantidade caiu para 210 milhões de obras diferentes no mundo. Houve então uma nova avaliação, que excluiu textos impressos como relatórios, transcrição de gravações, mapas e outras publicações que não poderiam ser classificadas como livro.
O Google calculou, por fim, 146 milhões de exemplares impressos e encadernados. A última etapa da pesquisa excluiu documentos governamentais e folhetins e artigos autônomos que, na verdade, foram idealizados como um volume único.
Chegou-se ao número de 129.864.880 de livros diferentes no mundo. Os dados referem-se, porém, apenas até o último domingo.
Segundo o Google, o ISBN, sistema internacional padronizado que identifica numericamente os livros segundo o título, o autor, o país e a editora, foi apenas parcialmente considerado pela pesquisa, porque só passou a ser amplamente adotado no mundo no início dos anos 1970.

quarta-feira, 26 de maio de 2010

Apple Surpasses Microsoft as Most Valuable Technology Company

Não sou acionista e não pretendo ser; não ganho nada com isso. Sou apenas um usuário, durante toda a minha vida informática, dos produtos da Apple. Estou escrevendo num MacBookPro e uso um iPhone, apenas isso. Acho que a companhia merece o título concedido agora.
Mas atenção: a estratégia perseguida pela Apple é muito arriscada: ao manter sua tecnologia proprietária, fechada à clonagem e ao licensiamento ostensivo, ela pode perder mercado para concorrentes baseados em tecnologias abertas.
Quase ocorreu isso, 14 anos atrás, na concorrência entre o sistema operacional da Apple e o Windows, que estava sendo lançado pela Microsoft. Pode ocorrer o mesmo entre o iPhone (e seus derivados) e o telephone da Google, baseado em outra plataforma, aberta a inovações de terceiros. Ver o artigo mais abaixo.
Paulo R Almeida

Apple Surpasses Microsoft as Most Valuable Technology Company

Apple, the maker of iPods, iPhones and iPads, overtook Microsoft, the computer software giant, on Wednesday to become the world's most valuable technology company.

In intraday trading in the afternoon session, Apple shares rose 1.8 percent, which gave the company a value of $227.1 billion. Shares of Microsoft declined about 1 percent, giving the company a market capitalization of $226.3 billion.

This changing of the guard caps one of the most stunning turnarounds in business history, as Apple had been given up for dead only a decade earlier. But the rapidly rising value attached to Apple by investors also heralds a cultural shift: Consumer tastes have overtaken the needs of business as the leading force shaping technology.

Read More:
http://www.nytimes.com/2010/05/27/technology/27apple.html?emc=na

Apple's Second Date with History
By HOLMAN W. JENKINS, JR.
The Wall Street Journal, Opinion, May 26, 2010

Whose phone strategy is smarter in the long run—Apple's or Google's?
Apple almost went out of business 14 years ago, and many would have blamed what seemed one of the seminal business blunders in history.

Bill Gates was chatting with students at Stanford at the time and recalled letters he'd written to Steve Jobs begging him to allow cloning of Apple hardware. Had Mr. Jobs complied, Apple's operating system might have become the de facto universal standard, the one everybody wrote software for—a role that fell to Windows instead.

If you think missing out on the riches that Microsoft created for its shareholders was an error, Mr. Jobs erred. Then again, the Web came along to take the deathly sting out of the battle of the operating systems, and Apple resurrected itself as a maker of tasty computing devices for a segment of the public that valued tastiness.

Historical analogies are one of the cheapest in the columnist's bag of tricks, and a temptation usually to be resisted. But here goes: Isn't Steve Jobs replaying the gamble that almost broke Apple?

Google may not be Microsoft, exactly: For one thing, Google is giving away its smartphone operating system, known as Android, for free. Nor will the battle yield a similar winner-take-all outcome. But otherwise the effects are likely to be the same.

Because Mr. Jobs insists on keeping software and hardware under tight control, Google's platform is the one that will benefit from competition among multiple handset makers, producing lower prices and faster innovation, including a flurry of soon-to-arrive tablets and a variety of new devices aimed at niches (say, with a focus on navigation or texting).

Likewise, because Mr. Jobs insists on vetting all applications that run on his phones via the iTunes App Store, you'll need an Android phone to capture the full benefit of openness to the Web. Soon, Android users can expect their available services and apps permanently to outstrip those available to iPhone users through the App store.

Now, as then, the full stakes are only dimly perceived even by the participants. Then, it turned out to be the PC's world-wide adoption as the indispensable productivity tool. Today the term "smartphone" is scarcely adequate to describe a future in which individuals, wherever they go, whatever they do, will always have constant, instant access to the resources of the global "cloud."

Here, another Google advantage is likely to manifest itself over time. It makes its money from advertising (and from collecting data it can sell to advertisers) and its customers reciprocate by wanting services for free, which means advertising-supported.

In contrast, Apple makes its money from hardware sales, and by strong-arming its way to a share of users' telecom subscriber fees and infotainment purchases—all of which could be ripe to be competed away in a dynamic cloudphone marketplace.

The dangers of Google's approach? With so many different Android phones floating around and with so much openness to the Web, the search giant risks delivering a crummy, fragmented, even disastrous user experience, with security leaks, viruses and customer service that fails when needed most.

For Apple, the immediate danger is overreach, undermining its ability to deliver an ineffably superior user experience that just pleases. Apple has decided it needs an advertising strategy. It will need a TV strategy, especially after Google last week announced a version of Android to bring the cloud cornucopia to the biggest, best screen yet. Apple may also find it needs a strategy to compete in search. It certainly will need a strategy to make sure its infotainment offerings through iTunes don't fall behind in price and variety what Android users can get through their browsers.

That's a plateful for a company that, until recently, could focus almost entirely on perfecting the interface between its customer and the underlying electronics. But history has dealt Apple one break the second time around. Its earlier battle with Microsoft was winner-take-all thanks to an historical accident—the failure of the Web to introduce itself a bit earlier and blow up what a Microsoft judge called the "applications barrier to entry."

Apple this time understands (we hope) that it isn't playing for all the marbles, but can build a very nice business on just those customers who crave a premium service tightly controlled by the wonderful Mr. Jobs, even if it means paying a bit more and forgoing access to a lot of Web goodies that might not work so well in favor of a smaller number that work really well.

Still, we'd rather be Google. Why? Because Google can fail at everything but as long as it keeps its search box at the center of our digital lives, the ad gusher will continue to flow.