Kitap, gazete, dergi gibi basılı bilgi ve görsel kaynakların özel geliştirilmiş cihazlarla taranarak pdf, resim, word, excel, text gibi dosya formatlarına OCR yaparak dönüştürme işlemi.
Teknolojinin her geçen gün hızla geliştiği dönemlerde bilgiye ulaşmak arama motorları sayesinde çok kolay gibi gözüksede kitaplar vazgeçilmez kaynaklar olarak kalmaktadır. Kitapların dezavantajları ise evinizdeki veya kütüphanenizde aradığınız bilgiye ulaşmanız hangi kitapta, hangi sayfada neyin olduğunu ezbere bilmiyorsanız oldukça zordur. Kitapların dezavantajlarından biride kitapları her gittiğiniz yere götüremezsiniz. Ayrıca en az 50$ lar civarından başlayan sektör literatürü ile ilgili kitaplar, firmalarda veya kurumlarda aynı anda sadece bir kişi tarafından kullanılabilmektedir ve belli bir süre sonra bu kitaplar ya kullanılamaz hale gelir ya da ya kaybolurlar. Kitapların içersinde arama yapamazsınız ve alıntı yapmak istediğiniz yerleri elle yazmanız gerekebilir.
Hizmetlerimiz kitapların ve basılı diğer bilgi ve görsel kaynakların temel olarak iki tip işlem sonucunda dijital ortama aktarılmasını içermektedir.
Birinci işlem Kitap, Dergi, Gazete, veya başka herhangi bir basılı bilgi kaynağının özelliklerine göre farklı cihazlarda taranarak renk, dosya boyutu, kalite gibi optimizasyonları yaparak dijital ortama aktarılmasıdır.
İkinci işlem ise taranan kitap veya diğer kaynaklardaki yazılar üzerinde düzenleme yapmak, web sayfasında yayınlamak, oluşturulan dosya içerisinde arama yapmak, oluşturulan veriler üzerinde analizler yapmak veya alıntı yapmak isteyen müşterilerimize sunduğumuz OCR hizmetimizdir. Bu hizmetimizde belgeler tarandıktan sonra profesyonel yazılımlar ve kendi geliştirdiğimiz uygulamalar ile mümkün olduğu kadar az hata ile yazı haline dönüştürülmektedir. Oluşan verilerin tüm satırları manüel olarak kontrol edilip hatalar düzeltilmektedir. Bu kontrolden sonra yine kendi uygulamalarımız ile 2 nci bir hata kontrolünden geçerek kelime ve kelime grupları hataları giderilmektedir. Son olarak istemiş olduğunuz dosya tipine dönüştürülen veriler orijinal sayfa yapısı ve görüntüsüne dönüştürürülerek tarafınıza iletilir.
OCR veya Optical Character Recognition olarak bildiğimiz teknolojisinin Türkçe anlamı Optik Karakter Tanımlama anlamına gelmektedir. OCR kitap veya belge tarayıcı makinalarla taranan yazı ve resimlerin düzenlenebilir word, excel, text gibi kelime işlemci veya hesap tabloları haline dönüştürülme işlemidir.
Taranan sayfalar resim olarak oluştukran sonra OCR yazılımları tarafından bu resmin içindeki pixeller incelenerek resimler ve harfler tek tek tesbit edilir ve bu resim olarak bulunan harfler, rakamlar ve semboller çeşitli algoritmalar kullanılarak el ile yazılmış gibi harf, rakam, semboller ve resimlere dönüştürülerek istenilen dosya formatında kaydedilir.
OCR programları bilgi kaynağının baskı kalitesi, yazı tipi boyutları, kağıt kalitesi, gibi etkenlere bağlı olarak yüksek oranlarda hatalı tanımlama yapabilmektedir. Bizim diğer firmalardan farkımız oluşan hatalı tanımlamaları sadece bu amaçla geliştirdiğimiz yazılımlarla ve manüel olarak sayfa sayfa kontrol ederek gidermemiz ve hata düzeyini hiç yok denecek kadar aza indirip orijinalininin birebir kopyasını oluşturmamızdır.
Kitap Tarama hakkında daha detaylı bilgi için www.kitaptarama.com sayfamızı ziyaret edebilirsiniz.