กระบวนการตัดสินใจมาร์คอฟ (MDP)

ผู้เขียน: Laura McKinney
วันที่สร้าง: 5 เมษายน 2021
วันที่อัปเดต: 22 มิถุนายน 2024
Anonim
Markov Decision Processes
วิดีโอ: Markov Decision Processes

เนื้อหา

คำนิยาม - Markov Decision Process (MDP) หมายถึงอะไร

กระบวนการตัดสินใจของมาร์คอฟ (MDP) เป็นสิ่งที่มืออาชีพเรียกว่า "กระบวนการควบคุมสุ่มแบบไม่ต่อเนื่อง" โดยอาศัยพื้นฐานทางคณิตศาสตร์ที่บุกเบิกโดยนักวิชาการชาวรัสเซีย Andrey Markov ในช่วงปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20


ข้อมูลเบื้องต้นเกี่ยวกับ Microsoft Azure และ Microsoft Cloud | ในคู่มือนี้คุณจะได้เรียนรู้ว่าการประมวลผลแบบคลาวด์คืออะไรและ Microsoft Azure สามารถช่วยคุณในการโยกย้ายและดำเนินธุรกิจจากคลาวด์อย่างไร

Techopedia อธิบายกระบวนการตัดสินใจมาร์คอฟ (MDP)

วิธีหนึ่งในการอธิบายกระบวนการตัดสินใจของมาร์คอฟและเครือมาร์คอฟที่เกี่ยวข้องคือสิ่งเหล่านี้เป็นองค์ประกอบของทฤษฎีเกมสมัยใหม่ที่ระบุไว้ในการวิจัยทางคณิตศาสตร์ที่ง่ายขึ้นโดยนักวิทยาศาสตร์ชาวรัสเซียเมื่อหลายร้อยปีก่อน คำอธิบายของกระบวนการตัดสินใจของมาร์คอฟคือศึกษาสถานการณ์ที่ระบบอยู่ในบางรัฐที่กำหนดและเดินหน้าต่อไปยังรัฐอื่นตามการตัดสินใจของผู้มีอำนาจตัดสินใจ

ห่วงโซ่มาร์คอฟเป็นแบบจำลองแสดงลำดับเหตุการณ์ที่โอกาสของเหตุการณ์ที่กำหนดขึ้นอยู่กับสถานะที่บรรลุก่อนหน้านี้ ผู้เชี่ยวชาญอาจพูดคุยเกี่ยวกับ "พื้นที่ของรัฐที่นับได้" ในการอธิบายกระบวนการตัดสินใจของมาร์คอฟ - บางคนเชื่อมโยงแนวคิดของรูปแบบการตัดสินใจของมาร์คอฟกับรูปแบบ "สุ่มเดิน" หรือโมเดลสุ่มอื่น ๆ ตามความน่าจะเป็น สตรีทโมเดลการเคลื่อนไหวของส่วนของผู้ถือหุ้นขึ้นหรือลงในความน่าจะเป็นของตลาด)


โดยทั่วไปกระบวนการตัดสินใจของมาร์คอฟมักจะนำไปใช้กับเทคโนโลยีที่ทันสมัยที่สุดที่ผู้เชี่ยวชาญกำลังทำงานอยู่ในปัจจุบันเช่นหุ่นยนต์อัตโนมัติและแบบจำลองการวิจัย