ABBYY FineReader Ekspres 8.4: mengenali teks dari sumber on the fly (kode distribusi selesai)
Makradar Teknologi / / December 19, 2019
konten digital, dan versi elektronik dari dokumen mengelilingi kita di semua sisi. Kertas dalam hidup kita adalah hampir tidak ada ruang yang tersisa. Surat kabar dan majalah telah pindah ke format online dari buku yang kita baca di e-ink reader atau tablet, surat biasa telah menggantikan email dan sms. Namun, kadang-kadang kita harus bermain-main dengan kertas pertama untuk mendapatkan mereka salinan elektronik. Di sini kita datang ke bantuan dari program khusus yang menggunakan teknologi OCR untuk OCR teks (Optical Character Recognition). Yang paling terkenal adalah diragukan lagi ABBYYFineReader. Anda dapat menggunakannya untuk mengkonversi dokumen kertas ke format yang dapat diedit, dan menyimpan PDF ke teks dicari. Dan hari ini kita memiliki kesempatan besar untuk belajar lebih banyak tentang hal itu.
* * *
Untuk Mac, ABBYY penawaran hanya FineReader Express, namun memiliki fungsi yang diperlukan. Fitur utama dari ABBYY FineReader Express adalah akurasi pengakuan dan retensi tata letak, dukungan untuk banyak bahasa (171 bahasa ke tiga bahasa dalam satu dokumen), transformasi dan penciptaan PDF (konversi PDF ke format yang dapat diedit), editor untuk daerah menandai user (teks, tabel, gambar) dan sederhana, user-friendly interface Program.
tampilan pertama
jendela operasi FineReader Express adalah cukup minimalis, ada hanya ada item yang paling diperlukan. Panel samping mengandung sketsa menambahkan halaman dan pada tombol panel isntrumentov dengan daftar drop-down untuk memilih bahasa dan file output. Masih ada konversi dan tombol zoom. Jika tidak, berkorespondensi antarmuka untuk versi express cepat, yang bertaruh pada pelaksanaan otomatis operasi dengan minimal konfigurasi dan partisipasi pengguna.
Lulus tes
Setelah meluncurkan FineReader bertemu kita jendela kompak dengan pilihan skenario. Di sini kita diminta untuk memilih sumber capture: scanner, fax, atau membaca dari sebuah file. Hal ini juga dianjurkan untuk menentukan bahasa dokumen (atau bahasa, jika lebih dari satu) - itu akan membantu untuk meningkatkan akurasi pengakuan dokumen asli. Nah, sebenarnya format file output, semuanya sederhana - memilih berdasarkan jenis dokumen kertas.
Scanner di tangan saya tidak punya, tapi itu lebih baik - menggunakan sebagai sumber dari foto Dibuat dengan bantuan dari iPhone, saya rumit tugas untuk mengenali teks. Sebagai contoh dari teks, saya mengambil salah satu buku dari istrinya, serta contoh tabel - beberapa lama konsinyasi Film kerja iPhone. Nah, mari kita mulai.
Setiap halaman dengan teks
Karena kurangnya scanner Aku hanya melakukan foto buku turn - foto ruang normal cahaya, tidak ada tripod, dan tweak lainnya. Berikut adalah asli:
Mari kita lihat apa yang dapat dilakukan dengan FineReader. Kita menetapkan bahwa kita ingin menarik keluar teks foto, mendefinisikan bahasa seperti Rusia, dan memulai proses.
Untuk kredit, aplikasi tersebut harus mengatakan bahwa seluruh teks didefinisikan, termasuk sengaja harus menekuk halaman yang berdekatan. Sepotong meja, yang saya secara khusus tersisa di frame, yang didefinisikan sebagai gambar yang diharapkan. Tapi itu tidak menakutkan, karena kita secara manual dapat mengubah domain, tentukan jenis (jika program ini tidak diatur dengan benar) dan menghapus bidang, pengakuan dari yang diperlukan. Semua manipulasi butuh waktu kurang dari satu menit, tapi pada akhirnya saya tiba di sini adalah hasil yang cukup dapat diterima:
Setelah proofreading pendek dan suntingan dokumen siap. Saya rasa ini adalah hasil yang baik untuk suatu proses pengenalan yang cepat, hampir otomatis.
mengenali tabel
Sebagai meja eksperimental menyajikan tagihan bersahaja, yang juga difilmkan pada iPhone. Ada sudah digunakan Ukraina (bersama dengan cek dukungan bahasa), yang juga baik untuk pengalaman kami. Memilih script baru (⌘N) Menunjukkan sumber - baca dari file, bahasa - Ukraina, dan file output - meja.
Program ini berpikir selama beberapa detik, dan di sini kita memiliki hasilnya:
Dengan program tabel tidak ditangani dengan baik, tetapi lebih atau kurang dapat diterima, pada prinsipnya, teks definisi, kecuali alasan untuk menyelesaikan sel-sel yang tidak dalam dokumen asli. Ada harus bermain-main sedikit lebih lama untuk mendapatkan bentuk akhir dari dokumen peta, tapi lebih mudah daripada mengetik tanda dengan tangan dari awal.
Simpan ke PDF
Saat menyimpan ke PDF, program ini sayangnya tidak meningkatkan citra asli (kontras, brightness) dan ditempatkan di PDF-dokumen seperti. Tapi kurang, teks pencarian hadir, dan yang baik itu.
menghasilkan
Seperti alat apapun, FineReader memiliki pro dan kontra. Titik-titik kuat, selain karakteristik menyatakan produsen, adalah bahwa OCR tabel dan karya cukup baik, dan mengkonversi ke PDF, seperti yang dijanjikan, mendukung pencarian teks. The downside adalah kurangnya pilihan dan sarana yang sangat sedikit untuk secara manual mengendalikan proses. Tapi ini sebagian dibenarkan, fakta bahwa itu adalah versi ekspres dan bekerja secara otomatis.
Kode untuk FineReader Ekspres Program won Gregory Ushar dan Nikolai Blinov. Selamat! Pesan Pribadi Anda, kode dikirim.