หลายองค์กรเริ่มโปรเจกต์การจัดการเอกสารอัตโนมัติด้วยเป้าหมายที่ฟังดูเรียบง่าย: ลดงานมือ ทำให้เร็วขึ้น ประหยัดคน และประหยัดเวลา โดยเฉพาะฝั่งบัญชีเจ้าหนี้ (AP) ที่ต้องรับใบแจ้งหนี้จำนวนมากทุกเดือน
อย่างไรก็ตาม องค์กรมักเผชิญกับความท้าทายในการนำระบบอัตโนมัติและ AI มาใช้ใน การ ทำงาน ด้านการเงิน ไม่ว่าจะเป็นความซับซ้อนในการผสานเทคโนโลยี ความปลอดภัยของข้อมูล การจัดการการเปลี่ยนแปลง และการรักษาสมดุลระหว่างเทคโนโลยีกับการควบคุมของมนุษย์ที่เกี่ยวกับกระบวนการทางการเงิน การทำงานของเทคโนโลยี OCR ในการประมวลผลใบแจ้งหนี้และเอกสารอื่นๆ โดยสแกนและแปลงข้อมูลจากเอกสารกระดาษหรือไฟล์ภาพให้กลายเป็นข้อมูลดิจิทัลแบบอัตโนมัติ ที่สามารถนำไปใช้ได้ทันที
แต่เมื่อนำมาใช้จริงสิ่งที่พบคือ ระบบดึงข้อมูลออกมาได้ แต่ข้อมูลนั้นไม่ถูกต้องทำให้ส่งผลกระทบกับงานเป็นวงกว้าง OCR ใช้ วิธี เช่น การเปรียบเทียบรูปแบบ (Pattern Recognition) และการตรวจจับคุณลักษณะ (Feature Detection) เพื่อให้สามารถอ่านข้อมูลจากเอกสารที่หลากหลายฟอนท์และลายมือได้อย่างแม่นยำมากขึ้น
การนำเทคโนโลยีนี้มาใช้ให้เกิดประโยชน์นั้น หัวใจคือ การสร้างระบบที่สามารถทำงานได้เร็ว” แต่ต้อง “ได้ข้อมูลที่ถูกต้อง” และ “ตรวจสอบได้” เพราะใบแจ้งหนี้ใบเดียวที่ข้อมูลผิด สามารถก่อปัญหาต่อเนื่องได้มาก เช่น
ดังนั้น ถ้าจะทำ “ระบบอัตโนมัติ” ให้ได้ผลจริง คำถามแรกไม่ใช่ “ทำยังไงให้เร็วขึ้น” แต่ควรเป็น “ทำยังไงให้ข้อมูลที่เข้าระบบเชื่อถือได้ตั้งแต่ต้นทาง” ซึ่งต้องมี การผสานระบบที่เป็นแบบอัตโนมัติเข้ากับการควบคุมของมนุษย์เพื่อให้การดำเนินงานมีประสิทธิภาพสูงสุด
ในปัจจุบันเทคโนโลยี OCR สมัยใหม่ได้มีการผนวก เทคโนโลยีมากมากไม่ว่าจะเป็น AI หรือ machine learning เข้ามาร่วมในการทำงานให้ผู้ได้งานได้ข้อมูลที่น่าเชื่อถือที่สุด มีความแม่นยำสูงขึ้นและสามารถปรับแต่งให้เหมาะสมกับเอกสารแต่ละประเภทได้ดีขึ้น เพื่อให้เหมาะสมกับการใช้งานขององค์กรในการทำข้อมูลบัญชีการเงิน ที่ความผิดพลาดนั้นเป็นสิ่งที่ยอมรับไม่ได้ ในบทความนี้เราจะมาทำความเข้าใจกันว่า การใช้ OCR ทำไมจำเป็ฯต้องมี Human In The Loop เพื่อยืนยันความถูกต้องของข้อมูล
OCR (Optical Character Recognition) คือเทคโนโลยีที่อ่านตัวอักษรจากเอกสารสแกนหรือไฟล์ภาพ แล้วแปลงเป็นข้อมูลดิจิทัล จุดแข็งของ OCR คือ ความเร็ว และทำงานได้ดีเมื่อเอกสารมีตัวพิมพ์ชัด รูปแบบคงที่ และคุณภาพไฟล์สม่ำเสมอ
แต่ในงานการเงินจริง เงื่อนไขเหล่านี้แทบไม่เคยเกิดขึ้น ใบแจ้งหนี้จากผู้ขายจำนวนมากมีรูปแบบแตกต่างกัน คุณภาพเอกสารขึ้นกับการสแกน การส่งต่อ หรือกระบวนการของคู่ค้าที่ควบคุมไม่ได้ ทำให้ OCR พลาดได้ง่าย โดยเฉพาะในจุดสำคัญ
OCR เดี่ยวๆเป็น “เครื่องอ่าน” ที่ดี แต่ยังอาจจะเกิดความผิดพลาดใน ปกติ OCR ส่วนใหญ่ในตลาดมีอัตราความถูกต้องที่ 80% – 90% ซึ่งในทางปัฏิบัติ ผู้ใช้งานอาจมองว่าไม่ตอบโจทย์ในการใช้งานมากนัก เนื้องจากจะต้องมีเจ้าหน้าที่ทำการแก้ไขข้อผิดพลาดจากการอ่านของ OCR
ปัจจุบัญมีการนำ AI การผสาน OCR ช่วยให้ข้อมูลที่ได้นั้นถูกต้องมากขึ้น โดย AI แก้ไขเนื้อหาที่ได้จาก OCR นั้น ด้วยหลักความน่าจะเป็น เปรียบเหมือนกับระบบที่สามารถเข้าใจบริบทของเนื้อหาได้เหมือนมนุษย์ ทำให้ค่าความถูกต้องของข้อมูลอาจจะสูงถึง 95%-99% และสามารถช่วยงานผู้ใช้งานได้อย่างมาก
อย่างไรก็ตาม ข้อจำกัดที่ยังคงอยู่ก็คือ ข้อมูลตัวเลขตายตัว เช่น เลขที่เอกสาร ซึ่งเป็นข้อมูลที่ AI ไม่สามารถปรับปรุงแก้ไขให้ถูกต้องด้วยบริบทของเอกสารนั้นได้ AI จะไม่สามารถช่วยได้ ข้อมูลในส่วนนี้จึงจุดที่เสี่ยงที่สุดในกระบวนการอัตโนมัติ Human-in-the-Loop (HITL) จึงเป็นอีกหนึ่งส่วนประกอบที่สำคัญ
Human-in-the-Loop (HITL) คือการเพิ่ม Control layer ที่นำมนุษย์เข้ามาอยู่ในกระบวนการการอัตโนมัติเพื่อยืนยันข้อมูลจากการอ่านของ OCR ให้มีความถูกต้อง จึงเป็นการปิดจุดเสี่ยงตั้งแต่ต้นทาง แทนที่จะปล่อยให้ข้อมูลผิดไหลไปในระบบบัญชีแล้วค่อยแก้ไขปลายทาง ต้นทุนสูงและใช้เวลามากกว่า โดยเฉพาะในงานการเงินที่ข้อมูลผิดเพียงเล็กน้อยอาจกระทบเงินจริง
ในมุมของการออกแบบระบบ Human-in-the-Loop วิธีการทำงานของระบบนี้ไม่ใช่การนำคนกลับเข้ามาทำงานแทนระบบ แต่เป็นการวางชั้นควบคุม (control layer) ระหว่างกระบวนการอัตโนมัติกับระบบบัญชีจริง เพื่อให้ระบบสามารถทำงานได้เต็มประสิทธิภาพโดยไม่เพิ่มความเสี่ยงทางการข้อมูลที่อาจจะผิดพลาดได้ ระบบถูกออกแบบให้ตัดสินใจเองในกรณีที่ข้อมูลมีความมั่นใจสูงและมีความเสี่ยงต่ำ ขณะที่กรณีที่ข้อมูลไม่ชัดเจน มีความขัดแย้ง ระบบจะหยุดและส่งเฉพาะจุดนั้นให้มนุษย์เข้ามารับรองก่อนเสมอ
กระบวนการเริ่มจากการรับเอกสารเข้าสู่ระบบ ไม่ว่าจะผ่านอีเมล พอร์ทัล หรือการอัปโหลดโดยตรง จากนั้นระบบจะประมวลผลด้วย OCR และโมเดล AI วิธีการนี้จะดึงข้อมูลสำคัญ เช่น ผู้ขาย หมายเลขเอกสาร PO รายการบรรทัด ภาษี และยอดรวม พร้อมทั้งให้คะแนนความมั่นใจในแต่ละฟิลด์ควบคู่กับการตรวจสอบตามกฎธุรกิจ เมื่อข้อมูลทุกส่วนอยู่ในระดับที่ระบบมั่นใจ เอกสารจะถูกส่งต่อเข้าสู่ workflow บัญชีหรือ ERP โดยอัตโนมัติ แต่หากมีฟิลด์ใดฟิลด์หนึ่งที่ความมั่นใจต่ำหรือขัดกับกฎ ระบบจะส่งเฉพาะประเด็นนั้นเข้าสู่คิว HITL
บทบาทของมนุษย์ใน HITL ไม่ใช่การอ่านเอกสารทั้งใบ แต่เป็นการตัดสินใจบนข้อมูลที่ระบบชี้ว่ามีความเสี่ยง ผู้ตรวจจะเห็นภาพเอกสารพร้อมตำแหน่งที่ระบบไม่มั่นใจ ค่าที่ระบบอ่านได้ และค่าทางเลือกที่ระบบเสนอ เพื่อให้สามารถยืนยันหรือแก้ไขได้อย่างรวดเร็ว ตัวอย่างเช่น กรณีที่ยอดรวมอ่านได้แต่คุณภาพภาพต่ำ กรณีที่พบหมายเลข PO หลายค่า หรือกรณีที่ใบแจ้งหนี้ของผู้ขายใหม่มียอดสูงผิดปกติ การออกแบบเช่นนี้ช่วยลดภาระงานของคนลงอย่างมาก และทำให้การตรวจสอบมีประสิทธิภาพกว่าการตรวจทั้งเอกสาร
ทุกการตัดสินใจของมนุษย์ในกระบวนการนี้จะถูกบันทึกเป็นข้อมูลย้อนกลับ เพื่อใช้ปรับปรุงกฎและโมเดลในระยะยาว ทำให้ระบบเรียนรู้จากการใช้งานจริงและต้องพึ่งพาการตรวจของคนลดลงเรื่อย ๆ โดยไม่ลดความปลอดภัยของข้อมูล ในเชิงระบบ แนวคิดนี้ช่วยให้สามารถเพิ่ม throughput ของงานได้อย่างต่อเนื่อง ลดงานแก้ปลายน้ำใน ERP และสร้าง audit trail ที่ตรวจสอบได้ครบถ้วน
กล่าวโดยสรุป Human-in-the-Loop ในงานบัญชีเจ้าหนี้ไม่ใช่จุดอ่อนของระบบอัตโนมัติ แต่เป็นกลไกที่ทำให้ระบบกล้าปล่อยงานอัตโนมัติได้มากขึ้น เพราะมีจุดหยุดที่เหมาะสมให้มนุษย์เข้ามารับผิดชอบในกรณีที่ระบบไม่ควรตัดสินใจเอง และนี่คือเหตุผลที่การออกแบบ HITL อย่างถูกต้องช่วยเพิ่มทั้งความเร็ว ความถูกต้อง และความสามารถในการขยายระบบในระยะยาว
หนึ่งในข้อจำกัดสำคัญของการนำ OCR และ AI มาใช้ในงานการเงิน คือ ลักษณะของข้อมูลที่ระบบสร้างขึ้น
แม้ข้อมูลเหล่านี้จะมาจาก “ระบบ” แต่ไม่ได้หมายความว่ามีความเสี่ยงต่ำเหมือนข้อมูลที่เกิดจากการคำนวณตามกฎบัญชีหรือกฎธุรกิจโดยตรง
ข้อมูลจาก OCR และ AI ไม่ได้เกิดจากการคำนวณเชิงตรรกะ
แต่เกิดจากการ อ่านและตีความข้อมูลจากภาพหรือเอกสาร ผ่านโมเดลที่ไม่ได้เข้าใจบริบทแบบมนุษย์
ผลลัพธ์ที่ได้จึงเป็นข้อมูลเชิงความน่าจะเป็น ไม่ใช่ความถูกต้องแบบเด็ดขาด
ในทางปฏิบัติ นี่คือจุดอันตรายของการเงินอัตโนมัติ
เพราะข้อมูลที่มีความไม่แน่นอนเชิงโครงสร้าง ถูกนำไปใช้งานต่อ ราวกับ เป็นข้อมูลที่ระบบ “รับรองความถูกต้องแล้ว”
การมีมนุษย์อยู่ในกระบวนการ (Human-in-the-Loop) จึงไม่ได้มีหน้าที่แค่ “ช่วยตรวจ”
แต่ทำหน้าที่เป็น Data Owner ที่รับผิดชอบต่อความถูกต้องของข้อมูลก่อนที่ข้อมูลนั้นจะถูกบันทึกบัญชี หรือถูกนำไปใช้ในการจ่ายเงินจริง
กล่าวอีกนัยหนึ่ง HITL คือชั้นของความรับผิดชอบ (Accountability Layer)
ที่ช่วยเปลี่ยนข้อมูลจาก OCR/AI
จาก “ข้อมูลที่ระบบเดาได้”
ให้กลายเป็น “ข้อมูลที่องค์กรยอมรับและรับผิดชอบได้”
และนี่คือเหตุผลที่ HITL ไม่ใช่ความล้มเหลวของ Automation
แต่เป็นเงื่อนไขสำคัญที่ทำให้ Automation ในงานการเงิน ใช้งานได้จริงและตรวจสอบได้
หลายองค์กรมีคำถามเหมือนกันเมื่อเริ่มใช้ OCR และ AI ในงานบัญชีเจ้าหนี้ (AP)
“ถ้ายังต้องมีพนักงานมาตรวจสอบอยู่ แปลว่าการลงทุนระบบล้มเหลวหรือเปล่า?”
คำตอบคือ ไม่ใช่
ในความเป็นจริง การมี Human-in-the-Loop คือสิ่งที่ทำให้การลงทุนในระบบ คุ้มค่าและใช้งานได้จริง
ระบบไม่ได้มาแทนคน 100% แต่ช่วยงานได้ 70–80% ของทั้งกระบวนการ
ลองเทียบภาพการทำงานแบบเดิมกับแบบที่ใช้ OCR + AI
แต่แทนที่ต้องใช้พนักงาน 5 คนเหมือนเดิม
องค์กรต้องการเพียง พนักงาน 1–2 คน เพื่อทำหน้าที่ตรวจสอบและยืนยันข้อมูลก่อนเข้าระบบบัญชี
ผลลัพธ์ที่เกิดขึ้นคือ
นี่ไม่ใช่การ “เพิ่มคน”
แต่คือการ ย้ายบทบาทของคน จากคนพิมพ์ → คนควบคุมคุณภาพ
อีกความเข้าใจผิดคือคิดว่า “ถ้ามีคนใน loop แปลว่าต้อง standby ตรวจตลอดเวลา”
ในความเป็นจริง ระบบ HITL ที่ออกแบบดี (เช่นบน Orange Vision Form+)
จะทำให้การตรวจเป็น งานตามรอบ (batch-based) ไม่ใช่งานเฝ้าหน้าจอ
ถ้ามองให้ถูก การลงทุนใน OCR + AI + HITL คือ
ดังนั้น คำถามไม่ใช่
“ทำไมยังต้องมีคนตรวจ?”
แต่ควรเป็น
“เรากำลังใช้คน 1 คน ให้ทำงานแทน 3–4 คนได้อย่างไร ด้วยระบบนี้?”
และนี่คือเหตุผลที่การมี Human-in-the-Loop
ไม่ใช่ความล้มเหลวของ Automation
แต่คือ เงื่อนไขที่ทำให้ Automation คุ้มค่า ใช้งานได้จริง และขยายได้ในระยะยาว
ถ้าคุณอยากให้ภาพชัด ลองคิดเป็น “ชั้น” ตามลำดับการไหลของเอกสาร
การวัดผลเป็นตัวกันหลงทาง เพราะถ้าคุณวัดแค่ “จำนวนใบที่ OCR อ่านได้” คุณอาจคิดว่าระบบดีแล้ว ทั้งที่งานจริงหนักอยู่ที่ข้อยกเว้น
ในยุคที่การเงินอัตโนมัติกลายเป็นหัวใจสำคัญขององค์กร การนำเทคโนโลยี OCR (Optical Character Recognition) และ Human-in-the-Loop (HITL) มาใช้ในกระบวนการประมวลผลข้อมูลทางการเงินนั้น ไม่เพียงแต่ช่วยให้การจัดการข้อมูลมีประสิทธิภาพและรวดเร็วมากขึ้น แต่ยังเพิ่มความสามารถในการจัดการข้อมูลที่ซับซ้อนและมีปริมาณมากได้อย่างต่อเนื่อง อย่างไรก็ตาม ความปลอดภัยของข้อมูล (Data Security) ยังคงเป็นประเด็นสำคัญที่องค์กรไม่ควรมองข้าม
การใช้ OCR และ HITL ในการประมวลผลข้อมูลทางการเงิน เช่น ใบแจ้งหนี้ การชำระเงิน หรือการจัดการข้อมูลลูกค้า ช่วยให้สามารถดำเนินการได้อย่างรวดเร็วและแม่นยำ แต่ในขณะเดียวกัน ข้อมูลที่เกี่ยวข้องกับทางการเงินเหล่านี้มักเป็นข้อมูลที่มีความละเอียดอ่อนและมีความเสี่ยงสูงต่อการถูกละเมิดหรือโจรกรรมข้อมูล ดังนั้น การออกแบบระบบต้องให้ความสำคัญกับมาตรการความปลอดภัยในทุกขั้นตอน
มาตรการสำคัญที่ควรนำมาใช้ในระบบ OCR + HITL ได้แก่ การเข้ารหัสข้อมูลทั้งขณะรับส่งและขณะจัดเก็บ การควบคุมสิทธิ์การเข้าถึงข้อมูลอย่างเข้มงวด การบันทึกและตรวจสอบการดำเนินการ (audit trail) เพื่อให้สามารถตรวจสอบย้อนหลังได้ รวมถึงการอัปเดตระบบและนโยบายความปลอดภัยอย่างต่อเนื่อง เพื่อให้สามารถรับมือกับความเสี่ยงใหม่ๆ ที่อาจเกิดขึ้นในอนาคต
การมี Human-in-the-Loop ในกระบวนการประมวลผลข้อมูลทางการเงิน ยังช่วยให้สามารถตรวจสอบและยืนยันความถูกต้องของข้อมูลที่มีความเสี่ยงหรือข้อยกเว้นได้อย่างมีประสิทธิภาพ ลดโอกาสเกิดข้อผิดพลาดหรือการทุจริตในระบบอัตโนมัติ และยังช่วยให้การจัดการข้อมูลทางการเงินเป็นไปอย่างถูกต้องและโปร่งใส
องค์กรที่นำระบบ OCR + HITL มาใช้ในการเงินอัตโนมัติ จึงควรให้ความสำคัญกับการจัดการความเสี่ยงและความปลอดภัยของข้อมูลอย่างเข้มงวด ไม่ว่าจะเป็นการประมวลผลข้อมูล การจัดเก็บ หรือการส่งต่อข้อมูลไปยังระบบอื่นๆ เพื่อให้มั่นใจว่าข้อมูลทางการเงินที่สำคัญจะได้รับการปกป้องอย่างดีที่สุด
สุดท้ายนี้ การใช้เทคโนโลยี character recognition และระบบอัตโนมัติในงานการเงินจะช่วยให้ธุรกิจมีความสามารถในการจัดการข้อมูลได้อย่างมีประสิทธิภาพและแม่นยำมากขึ้น แต่ต้องไม่ลืมว่าความปลอดภัยของข้อมูลคือรากฐานสำคัญที่จะทำให้ระบบเหล่านี้น่าเชื่อถือและสามารถนำไปใช้ในทางการเงินได้อย่างมั่นใจในระยะยาว
ถ้าคุณอยากเริ่มให้เห็นผลเร็วและการคุมความเสี่ยง แนะนำแนวทางนี้ เพราะสามารถเรียนรู้จากข้อผิดพลาดและปรับปรุงกระบวนการได้อย่างต่อเนื่อง โดยเน้นการเรียนรู้ทั้งจากข้อมูลและความคิดเห็นของมนุษย์เพื่อเพิ่มประสิทธิภาพและความแม่นยำของระบบ OCR
ส่วนใหญ่เริ่มจากใบแจ้งหนี้ เพราะเป็นปริมาณหลักและกระทบเงินสดโดยตรง
จดว่า OCR/ระบบพลาดตรงไหนบ่อยที่สุด เช่น ยอดรวม ภาษี PO วันที่ครบกำหนด รายการบรรทัด แล้วนำข้อมูลที่ได้จากการเก็บแพตเทิร์นความผิดพลาดเหล่านี้มาใช้ในการปรับปรุงระบบให้มีประสิทธิภาพและความถูกต้องมากยิ่งขึ้น
คนตรวจควรเห็นเฉพาะสิ่งจำเป็น:
ทุกการแก้ของคนควรถูกเก็บเป็นข้อมูลย้อนกลับ เพื่อปรับกฎและการปรับโมเดล ไม่อย่างนั้นคุณจะได้ระบบที่ต้องตรวจหนักเท่าเดิมตลอดไป
OCR ทำอะไรได้ / ทำอะไรไม่ได้: OCR ช่วย “อ่านและดึงข้อมูล” จากเอกสารได้เร็ว แต่ยังมีความเสี่ยงที่จะดึงข้อมูลผิดพลาดในฟิลด์สำคัญที่ไม่ควรผิด การใช้แค่ OCR นั้นจึงยัง “ไม่เพียงพอ” สำหรับงานการเงินที่ข้อมูลต้องถูกและตรวจสอบได้
HITL คืออะไร: Human-in-the-Loop คือการออกแบบให้กระบวนการที่มีผู้รับผิดชอบของข้อมูลนั้น เป็นคนตรวจสอบความถูกต้อง เพื่อหยุดข้อมูลผิดก่อนนำข้อมูลนั้นไปใช้
5-Layer Framework (ทำให้ใช้ได้จริง): Intake (รับเอกสารเป็นระบบ) → Capture+Classification (อ่าน/จำแนก/จับคู่) → Confidence+Rules (ให้คะแนนความมั่นใจ+เช็คกฎธุรกิจ) → HITL Review Queue (คิวตรวจเฉพาะจุด พร้อม audit trail) → Downstream (ส่งเข้า ERP/อนุมัติ/จ่าย)
KPI ที่ต้องวัด: Field-level accuracy, Exception rate, First-pass yield, Cycle time, Exception aging, Cost per invoice, Early payment discount capture, Duplicate/overpayment indicators (เน้นผลลัพธ์จริง ไม่ใช่แค่ “OCR อ่านได้กี่ใบ”)
ในงานทางการเงิน ความต่างระหว่างข้อมูลที่ “พอใช้ได้” กับข้อมูลที่ “ถูกต้องนำไปใช้ได้นั้น” มักไม่ได้อยู่ที่ใครมี OCR เก่งกว่า แต่อยู่ที่ใครออกแบบระบบที่ทำให้ข้อมูลที่ออกมานั้นน่าเชื่อถือลด ความเสียง มีผู้รับผิดชอบ และตรงตามหลัก Data Governance ที่องค์กรออกแบบไว้
สุดท้ายแล้ว องค์กรไม่ได้ต้องการแค่ระบบที่เร็ว แต่ต้องการระบบที่ ลดงานและได้ข้อมูลที่ถูกต้องน่าเชื่อถือ และนั่นคือเหตุผลที่ OCR อย่างเดียวไม่พอ และ Human-in-the-Loop คือชิ้นส่วนที่ทำให้ภาพนี้สมบูรณ์มากขึ้น