Nouveau consultables numérisées Docs et une vis commune Up
5 janvier 2009 par Michael Alexander · Laisser un commentaire
Je mentionne G oogle si souvent que beaucoup de gens doivent penser que je suis payé par l'entreprise. Juste pour mémoire, ils ne me paient pas. Je ne peux pas m'empêcher de me-Google est toujours faire des choses cool.
Récemment, Google a indiqué qu'il est maintenant capable d'utiliser la reconnaissance optique de caractères à l'index des documents numérisés stockés au format Adobe PDF. Auparavant, l'entreprise rarement scannés docs car il ne pouvait pas être sûr des résultats de recherche. Selon le blog de Google:
Alors que nous avons indexé les documents enregistrés au format PDF pour un certain temps maintenant, les documents numérisés sont beaucoup plus difficile pour un ordinateur à lire. La numérisation est l'inverse de l'impression. Impression numérique transforme les mots en texte sur le papier, tandis que la numérisation rend une image numérique du document physique (et texte) de sorte que vous pouvez stocker et voir sur un ordinateur.
Pour faire un essai routier de cette nouvelle chose nouvelle, cliquez sur cette recherche de requête- Steady réussite dans un monde volatil et vous verrez un extrait du doc PDF dans les résultats de recherche suivie par la vue comme un lien HTML.
Convertir des fichiers PDF numérisés en texte
Inspiration Tech site de Digital a un angle sur cette nouvelle fonctionnalité utile de mentionner:
Si vous avez scanné les fichiers PDF sur votre disque dur mais il leur manque un logiciel d'OCR, vous pouvez toujours les convertir en texte reconnaissable, DI dit.
Créez un dossier sur votre site (par exemple, votre site est abc.com) et télécharger tous vos fichiers PDF dans le même dossier. Ensuite, créez une page Web publique que les liens vers tous les PDF. Attendez que le searchbots Google à l'araignée votre stuff. Après cette étape effectuée, le site de type: abc.com / pdf filetype: pdf de voir vos fichiers PDF au format HTML.
Lifehacker ajoute cette torsion au format PDF la conversion en HTML :
Vous pouvez utiliser Google Webmaster Tools de régner dans ce qui sera numérisé et indexé sur votre site, mais vous devez supposer que tout ce que vous mettez en ligne peut être trouvé par ceux qui recherchent pour cela.
Pouvez-vous dire ce qui cloche avec peine au-dessus de Lifehacker? Lire "21 mots qui sonnent à l'Identique, mais signifier des choses différentes." Quel mal dans cette image?










