Nova Searchable Scanned Docs e um parafuso comum Up

5 de janeiro de 2009 por Michael Alexander · Deixe um comentário

Menciono G oogle com tanta frequência que muitas pessoas devem pensar que eu estou sendo pago pela empresa. Apenas para o registro, eles não me pagam. Eu só não posso me ajudar, o Google está sempre fazendo coisas legais.

Recentemente, o Google disse que agora é capaz de usar o reconhecimento óptico de caracteres para indexar documentos digitalizados armazenados como Adobe PDFs. Anteriormente, a empresa raramente verificados docs porque não podia ter certeza dos resultados da pesquisa. acordo com o blog do Google:

Embora tenhamos indexado documentos salvos como PDFs há algum tempo, os documentos digitalizados são muito mais difícil para um computador para ler. A digitalização é o contrário da impressão. Impressão transforma palavras digitais em texto no papel, enquanto a digitalização torna uma foto digital do papel físico (e texto) para que você possa armazenar e visualizar em um computador.

Para ter um test drive desta coisa nova-nova, clique neste consulta de pesquisa- Sucesso Constante em um Volátil Mundial e você vai ver um trecho do documento PDF nos resultados da pesquisa , seguido pelo Vista como link HTML.

Converter PDFs digitalizados em texto

Site de tecnologia Digital Inspiration tem um ângulo sobre este novo recurso vale a pena mencionar:

Se você digitalizou arquivos PDF no seu disco rígido, mas falta o software de OCR, você ainda pode convertê-los em texto reconhecível, DI diz.

Crie uma pasta em seu site (digamos, o seu site é abc.com) e carregar todos os seus PDFs para a mesma pasta. Em seguida, crie uma página da Web pública que os links para todos os PDFs. Espere os searchbots Google à aranha seu material. Depois que é feito site, tipo: abc.com / pdf filetype: pdf para ver seus PDFs como HTML.

Lifehacker acrescenta que essa torção conversão de PDFs para HTML :

Você pode usar o Google Webmaster Tools a reinar em o que é digitalizado e indexado em seu site, embora você deva assumir qualquer coisa que você colocar on-line pode ser encontrada por aqueles que procuram por isso.

Pode dizer o que há de errado com sentença do Lifehacker acima? Leia "21 palavras que soam iguais, mas significam coisas diferentes." Que mal nesta foto?

Ops




Os comentários estão fechados.

Blog Tutorial