Membangun Solusi Dengan Azure AI Document Intelligence

Banyak formulir dan dokumen yang digunakan dalam bisnis bersifat umum di berbagai sektor, seperti faktur dan tanda terima. Microsoft Azure AI Document Intelligence menyediakan model bawaan untuk menangani jenis dokumen umum dengan mudah. Sebuah perusahaan yang mengelola jajak pendapat untuk perusahaan swasta dan partai politik menerima tanggapan peserta dalam bentuk kertas atau PDF online. Untuk menyederhanakan entri data, teknologi ini dipertimbangkan sebagai solusi, dengan kebutuhan untuk memastikan bahwa model bawaan dapat mengekstrak data yang bermakna dari formulir yang digunakan.

Azure AI Document Intelligence menyediakan model bawaan untuk mengekstrak data dari berbagai dokumen bisnis umum seperti faktur, tanda terima, dan formulir pajak tanpa perlu pelatihan tambahan. Model bawaan meliputi ekstraksi data dari kartu identitas, laporan bank, slip gaji, dokumen hipotek, dan cek. Selain itu, tersedia model untuk dokumen dengan struktur lebih umum, seperti model pembacaan teks, model dokumen umum, dan model tata letak yang mengekstrak teks serta strukturnya.

Model bawaan dirancang untuk mengekstrak berbagai jenis data dari dokumen, termasuk teks dari tulisan tangan dan cetakan, pasangan kunci-nilai seperti Weight: 31 kg, entitas seperti nama dan tanggal, tanda pilihan seperti kotak centang, tabel dengan isi dan strukturnya, serta bidang spesifik dari formulir tertentu seperti CustomerName dalam faktur. Model ini cocok untuk dokumen umum, tetapi untuk formulir industri khusus atau unik, hasil yang lebih akurat dapat diperoleh dengan model khusus yang memerlukan pelatihan menggunakan contoh formulir agar dapat memprediksi data dengan lebih baik.

source: https://learn.microsoft.com/en-us/training/paths/extract-data-from-forms-document-intelligence/

Model dalam Azure AI Document Intelligence

  1. Model Read
    • Model Read mengekstrak teks cetak dan tulisan tangan dari dokumen serta mendeteksi bahasa yang digunakan. Model ini menjadi dasar bagi semua model bawaan lainnya. Selain itu, Read Model mendukung lebih banyak bahasa untuk teks cetak dibandingkan tulisan tangan dan dapat menganalisis rentang halaman pada file PDF atau TIFF. Model ini cocok untuk dokumen tanpa struktur tetap.
  2. Model Dokumen Umum
    • Model ini memperluas fungsi Read Model dengan menambahkan deteksi pasangan kunci-nilai, entitas, tanda pilihan, dan tabel. Satu-satunya model yang mendukung ekstraksi entitas, termasuk nama orang, organisasi, alamat, nomor telepon, email, URL, IP address, serta tanggal dan waktu.
  3. Model Tata Letak
    • Selain mengekstrak teks, model ini mengidentifikasi tanda pilihan dan tabel dalam dokumen. Model ini berguna untuk memahami struktur dokumen yang kompleks, termasuk tabel dengan sel yang digabung, tanpa header, atau sudut miring saat digitalisasi. Model ini mengekstrak teks dalam sel tabel, ukuran serta posisi bounding box, status header, dan indeks baris serta kolom.
source: https://learn.microsoft.com/en-us/training/wwl-data-ai/work-form-recognizer/media/how-optical-character-recognition-works.png

Azure Document Intelligence adalah layanan AI berbasis cloud yang menggunakan OCR dan model deep learning untuk mengekstrak teks, pasangan kunci-nilai, tanda pilihan, dan tabel dari dokumen. Teknologi OCR-nya mendeteksi struktur dokumen dengan membuat bounding box di sekitar objek yang terdeteksi, lalu mengembalikan data dalam format terstruktur yang mempertahankan hubungan dari file asli.


ref:
learn.microsoft

Komentar