กำกับการรู้จำเสียง

ผู้เขียน: Eugene Taylor
วันที่สร้าง: 16 สิงหาคม 2021
วันที่อัปเดต: 22 มิถุนายน 2024
Anonim
รู้จำเสียง (Audio Recognition) ด้วย TensorFlow บน Colab
วิดีโอ: รู้จำเสียง (Audio Recognition) ด้วย TensorFlow บน Colab

เนื้อหา

คำจำกัดความ - การรู้จำเสียงกำกับหมายถึงอะไร

การรู้จำเสียง Directed เป็นประเภทของระบบรู้จำเสียงพูดที่ใช้การเขียนสคริปต์เพื่อลดตัวเลือกสำหรับการป้อนข้อมูล สิ่งนี้จะช่วยให้ "เศรษฐกิจ" ที่ดีขึ้นและการสร้างแบบจำลองที่แม่นยำยิ่งขึ้นสำหรับผลิตภัณฑ์ซอฟต์แวร์รู้จำเสียงพูด

ข้อมูลเบื้องต้นเกี่ยวกับ Microsoft Azure และ Microsoft Cloud | ในคู่มือนี้คุณจะได้เรียนรู้ว่าการประมวลผลแบบคลาวด์คืออะไรและ Microsoft Azure สามารถช่วยคุณในการโยกย้ายและดำเนินธุรกิจจากคลาวด์อย่างไร

Techopedia อธิบายการจดจำเสียงโดยตรง

ซอฟต์แวร์รู้จำเสียงที่นิยมที่สุดบางชนิดเป็นปลายเปิด - แปลความหมายของเสียงพูดได้เต็มรูปแบบผ่านเสียง อย่างไรก็ตามมีความท้าทายโดยธรรมชาติที่สร้างขึ้นในระบบรู้จำเสียงพูดปลายเปิด ตัวอย่างเช่นระบบจะต้องสามารถจัดการกับเสียงที่แตกต่างทั้งหมดซึ่งโดยทั่วไปต้องใช้พจนานุกรมขนาดใหญ่ของอัลกอริทึมและทรัพยากรอื่น ๆ

ด้วยการจดจำเสียงโดยตรงระบบจะต้องตีความจากตัวเลือกที่แตกต่างกันไม่กี่ตัว หนึ่งในตัวอย่างที่ดีที่สุดและพบบ่อยที่สุดคือเครื่องมือการตอบสนองด้วยเสียงแบบโต้ตอบ (IVR) ที่ผู้โทรพบในสภาพแวดล้อมของศูนย์บริการ เครื่องมือเหล่านี้ไม่สามารถคาดเดาคำพูดได้ทั้งหมด พวกเขามองหาตัวเลือกง่าย ๆ เช่น "ใช่" หรือ "ไม่" หรือวลีเช่น "พูดคุยกับตัวแทน" หรือ "ค้นหายอดคงเหลือ"

ดังนั้นการรู้จำเสียงพูดโดยตรงมักจะทำงานได้ดีขึ้นและสร้างผลลัพธ์ที่แม่นยำยิ่งขึ้นสำหรับแพ็คเกจซอฟต์แวร์ราคาไม่แพงสำหรับผลิตภัณฑ์ซอฟต์แวร์ประเภทนี้