การรวมกำไรสูงสุดช่วยให้ AlexNet เป็นเทคโนโลยีที่ยอดเยี่ยมสำหรับการประมวลผลภาพได้อย่างไร? googletag.cmd.push (ฟังก์ชั่น () {googletag.display (div-gpt-ad-1562928221186-0);}); Q: - เทคโนโลยี

เนื้อหา

Q:

การรวมกำไรสูงสุดช่วยให้ AlexNet เป็นเทคโนโลยีที่ยอดเยี่ยมสำหรับการประมวลผลภาพได้อย่างไร?

A:

ใน AlexNet นวัตกรรมโครงข่ายประสาทเทียมแนวคิดของการรวมกำไรสูงสุดถูกแทรกลงในแบบจำลองที่ซับซ้อนด้วยเลเยอร์ convolutional หลายส่วนเพื่อช่วยในการปรับและปรับปรุงงานที่เครือข่ายประสาททำงานกับภาพที่สิ่งที่ผู้เชี่ยวชาญเรียก “ กลยุทธ์การสุ่มตัวอย่างที่ไม่ใช่เชิงเส้น”

AlexNet ได้รับการยอมรับอย่างกว้างขวางว่าเป็นซีเอ็นเอ็นที่ยอดเยี่ยมโดยได้รับรางวัล ILSVRC 2012 (การท้าทายการรับรู้ภาพขนาดใหญ่ของ ImageNet) ซึ่งถูกมองว่าเป็นเหตุการณ์ต้นน้ำสำหรับการเรียนรู้ของเครื่องจักรและโครงข่ายประสาทเทียม (บางคนเรียกมันว่า )

ในกรอบของเครือข่ายที่การฝึกอบรมแบ่งออกเป็นสอง GPUs มีเลเยอร์ convolutional ห้าเลเยอร์เลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์สามเลเยอร์และการใช้งานร่วมกันสูงสุด

โดยพื้นฐานแล้วการรวมกำไรสูงสุดใช้ "พูล" ของเอาต์พุตจากชุดของเซลล์ประสาทและใช้กับค่าของเลเยอร์ที่ตามมา อีกวิธีหนึ่งในการทำความเข้าใจนี้คือวิธีการรวมกำไรสูงสุดสามารถรวมและทำให้ค่าง่ายขึ้นเพื่อให้ได้แบบจำลองที่เหมาะสมยิ่งขึ้น

การรวมกำไรสูงสุดสามารถช่วยคำนวณการไล่ระดับสี เราสามารถพูดได้ว่ามัน“ ลดภาระการคำนวณ” หรือ“ ลดการล้นเกิน” - ด้วยการลดขนาดตัวอย่างการรวมกำไรสูงสุดประกอบสิ่งที่เรียกว่า "การลดมิติ"

การลดมิติเกี่ยวข้องกับปัญหาของการมีรูปแบบที่ซับซ้อนที่ยากที่จะทำงานผ่านเครือข่ายประสาท ลองนึกภาพรูปร่างที่ซับซ้อนด้วยรูปทรงขรุขระขนาดเล็กจำนวนมากและทุก ๆ เส้นของเส้นนี้แทนด้วยจุดข้อมูล ด้วยการลดมิติข้อมูลวิศวกรกำลังช่วยให้โปรแกรมการเรียนรู้ของเครื่อง "ซูมออก" หรือสุ่มตัวอย่างจุดข้อมูลน้อยลงเพื่อทำให้แบบจำลองทั้งหมดเรียบง่ายขึ้น นั่นเป็นเหตุผลว่าทำไมหากคุณดูเลเยอร์ที่รวมกำไรสูงสุดและเอาท์พุทของมันบางครั้งคุณสามารถเห็นการสร้างพิกเซลที่ง่ายขึ้นซึ่งสอดคล้องกับกลยุทธ์การลดขนาด

AlexNet ยังใช้ฟังก์ชั่นที่เรียกว่า rectified linear units (ReLU) และการรวมกำไรสูงสุดสามารถเสริมให้กับเทคนิคนี้ในการประมวลผลภาพผ่าน CNN

ผู้เชี่ยวชาญและผู้ที่เกี่ยวข้องในโครงการได้ส่งโมเดลภาพสมการและรายละเอียดอื่น ๆ มากมายเพื่อแสดงโครงสร้างเฉพาะของ AlexNet แต่โดยทั่วไปแล้วคุณสามารถนึกถึงการรวมกำไรสูงสุดเป็นการรวมตัวกันหรือรวมเอาเซลล์ประสาทเทียมหลายตัวเข้าด้วยกัน กลยุทธ์นี้เป็นส่วนหนึ่งของการสร้างโดยรวมของ CNN ซึ่งได้กลายเป็นตรงกันกับการมองเห็นเครื่องจักรที่ทันสมัยและการจำแนกภาพ