Nova Searchable Scanned Docs e um parafuso comum Up
5 de janeiro de 2009 por Michael Alexander · Deixe um comentário
Menciono G oogle com tanta frequência que muitas pessoas devem pensar que eu estou sendo pago pela empresa. Apenas para o registro, eles não me pagam. Eu só não posso me ajudar, o Google está sempre fazendo coisas legais.
Recentemente, o Google disse que agora é capaz de usar o reconhecimento óptico de caracteres para indexar documentos digitalizados armazenados como Adobe PDFs. Anteriormente, a empresa raramente verificados docs porque não podia ter certeza dos resultados da pesquisa. acordo com o blog do Google:
Embora tenhamos indexado documentos salvos como PDFs há algum tempo, os documentos digitalizados são muito mais difícil para um computador para ler. A digitalização é o contrário da impressão. Impressão transforma palavras digitais em texto no papel, enquanto a digitalização torna uma foto digital do papel físico (e texto) para que você possa armazenar e visualizar em um computador.
Para ter um test drive desta coisa nova-nova, clique neste consulta de pesquisa- Sucesso Constante em um Volátil Mundial e você vai ver um trecho do documento PDF nos resultados da pesquisa , seguido pelo Vista como link HTML.
Converter PDFs digitalizados em texto
Site de tecnologia Digital Inspiration tem um ângulo sobre este novo recurso vale a pena mencionar:
Se você digitalizou arquivos PDF no seu disco rígido, mas falta o software de OCR, você ainda pode convertê-los em texto reconhecível, DI diz.
Crie uma pasta em seu site (digamos, o seu site é abc.com) e carregar todos os seus PDFs para a mesma pasta. Em seguida, crie uma página da Web pública que os links para todos os PDFs. Espere os searchbots Google à aranha seu material. Depois que é feito site, tipo: abc.com / pdf filetype: pdf para ver seus PDFs como HTML.
Lifehacker acrescenta que essa torção conversão de PDFs para HTML :
Você pode usar o Google Webmaster Tools a reinar em o que é digitalizado e indexado em seu site, embora você deva assumir qualquer coisa que você colocar on-line pode ser encontrada por aqueles que procuram por isso.
Pode dizer o que há de errado com sentença do Lifehacker acima? Leia "21 palavras que soam iguais, mas significam coisas diferentes." Que mal nesta foto?









Foi este tutorial foi útil?
Agora!
Chilrear
Nunca perca um tutorial!
Ou agarrar o feed RSS !