เรียนรู้วิธีใช้ไลบรารี Tesseract.js เพื่อแปลงรูปภาพเป็นข้อความใน Node.js ได้อย่างง่ายดายด้วยโค้ดเพียงไม่กี่บรรทัด บทช่วยสอนนี้ให้คำแนะนำทีละขั้นตอนและโค้ดตัวอย่างเพื่อช่วยคุณในการเริ่มต้น
การแปลงรูปภาพเป็นข้อความใน Node.js เป็นกระบวนการที่ค่อนข้างง่าย ซึ่งสามารถทำได้โดยใช้ไลบรารีและเทคนิคต่างๆ ในบล็อกโพสต์นี้ เราจะสำรวจวิธีหนึ่งในการดำเนินการนี้โดยใช้ไลบรารี Tesseract.js ซึ่งเป็นการใช้งาน JavaScript ของกลไก Tesseract OCR (Optical Character Recognition) ยอดนิยม
ขั้นแรก คุณจะต้องติดตั้งไลบรารี Tesseract.js ในโปรเจ็กต์ Node.js ของคุณ ซึ่งสามารถทำได้โดยใช้ npm ซึ่งเป็นตัวจัดการแพ็คเกจสำหรับ Node.js โดยการรันคำสั่งต่อไปนี้:
npm install tesseract.js
เมื่อติดตั้งไลบรารีแล้ว คุณจะสามารถใช้เพื่อแปลงรูปภาพเป็นข้อความได้โดยการนำเข้าไลบรารีลงในสคริปต์ Node.js ของคุณก่อน:
const tesseract = require('tesseract.js');
ถัดไป คุณจะต้องระบุเส้นทางไปยังรูปภาพที่คุณต้องการแปลงเป็นข้อความ ซึ่งสามารถทำได้โดยใช้รหัสต่อไปนี้:
const imagePath = './path/to/image.jpg';
เมื่อคุณระบุเส้นทางไปยังรูปภาพแล้ว คุณสามารถใช้ไลบรารี Tesseract.js เพื่อแปลงรูปภาพเป็นข้อความได้โดยการเรียกเมธอด recognize
และส่งผ่านเส้นทางไปยังรูปภาพเป็นอาร์กิวเมนต์ เช่น:
tesseract.recognize(imagePath) .then((result) => { console.log(result.text); });
รหัสสำหรับแปลงรูปภาพเป็นข้อความใน Node.js
// Import the Tesseract.js library const tesseract = require('tesseract.js'); // Specify the path to the image that you want to convert to text const imagePath = './path/to/image.jpg'; // Use the Tesseract.js library to convert the image to text tesseract.recognize(imagePath) .then((result) => { // Log the extracted text to the console console.log(result.text); });
recognize
เมธอดจะส่งคืนสัญญา ซึ่งจะแก้ไขด้วยข้อความที่ดึงมาจากรูปภาพ จากนั้นคุณจึงสามารถเข้าถึงข้อความนี้ได้โดยใช้เมธอด then
และบันทึกคุณสมบัติ text
ของออบเจ็กต์ผลลัพธ์ลงในคอนโซล
และนั่นมัน! ด้วยโค้ดเพียงไม่กี่บรรทัด คุณสามารถใช้ไลบรารี Tesseract.js เพื่อแปลงรูปภาพเป็นข้อความใน Node.js ได้ แน่นอนว่ายังมีห้องสมุดและเทคนิคอื่นๆ อีกมากมายที่สามารถใช้เพื่อทำงานนี้ให้สำเร็จได้ แต่นี่เป็นเพียงตัวอย่างหนึ่งของวิธีที่สามารถทำได้