การเรียนรู้การเสริมแรงสามารถมอบความปั่นป่วนแบบไดนามิกที่ดีสู่การตลาด

วิดีโอ: Aruba Dynamic Segmentation : วิวัฒนาการเครือข่ายแบบนิวนอมอล

เนื้อหา

การเสริมแรงการเรียนรู้คืออะไร?
ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ
เครื่องจักรสำหรับนักการตลาด
เร็ว ๆ นี้
กำลังคิดที่ใหญ่กว่า
เส้นทางไปสู่การยอมรับ

ที่มา: Juliatimchenko / Dreamstime.com

Takeaway:

การเรียนรู้การเสริมแรงเป็นชุดย่อยของปัญญาประดิษฐ์และการเรียนรู้ของเครื่องที่สามารถทำนายผลลัพธ์และช่วยให้ผู้ใช้ตัดสินใจได้ดีขึ้น

นักการตลาดกำลังมองหาโซลูชันที่ปรับขนาดได้และชาญฉลาดอย่างต่อเนื่องเมื่อพยายามที่จะได้เปรียบในสภาวะทางการตลาดที่มีการแข่งขันสูงขึ้น ไม่น่าแปลกใจที่ปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (ML) กำลังถูกนำมาใช้อย่างแพร่หลายโดยแบรนด์และองค์กรทางการตลาดของพวกเขา (หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับพื้นฐานของ ML โปรดดูที่การเรียนรู้ของเครื่อง 101)

สำหรับมือใหม่นั้น AI มักถูกพิจารณาว่าเป็นเทคโนโลยีเมื่อคอมพิวเตอร์ทำงานโดยอัตโนมัติตามที่มนุษย์ต้องการ การเรียนรู้ของเครื่องเป็นพื้นที่สำหรับใช้งานภายใน AI คือเมื่อคอมพิวเตอร์ได้รับเป้าหมายสุดท้าย แต่จำเป็นต้องคำนวณเส้นทางที่ดีที่สุดด้วยตนเอง

วันนี้เรากำลังเห็นเทคโนโลยีเหล่านี้ - โดยเฉพาะอย่างยิ่งการเรียนรู้ของเครื่องจักร - ถูกนำไปใช้ในหลาย ๆ ด้านของการตลาดรวมถึงการตรวจจับการฉ้อโกงโฆษณาการคาดการณ์พฤติกรรมผู้บริโภคระบบคำแนะนำการปรับแต่งที่สร้างสรรค์และอื่น ๆ

ในขณะที่ทุกอย่างดีและดีมีเทคโนโลยี offshoot ใหม่ที่สำหรับนักการตลาดกำลังจะส่งมอบอย่างแท้จริงตามความต้องการที่การเรียนรู้ของเครื่องกำลังสร้าง มันเรียกว่า "การเรียนรู้การเสริมแรง" (RL)

การเสริมแรงการเรียนรู้คืออะไร?

ขั้นตอนการเปลี่ยนจาก ML เป็น RL เป็นมากกว่าตัวอักษร งานส่วนใหญ่ที่ส่งมอบให้กับการเรียนรู้ของเครื่องนั้นเกี่ยวข้องกับการใช้ขั้นตอนเดียวเช่น "จดจำภาพนี้" "เข้าใจเนื้อหาหนังสือ" หรือ "จับการทุจริต" สำหรับนักการตลาดเป้าหมายทางธุรกิจเช่น "ดึงดูดรักษาและดึงดูดผู้ใช้" คือ หลายขั้นตอนและระยะยาวโดยเนื้อแท้แล้วไม่สามารถทำได้อย่างง่ายดายด้วยการเรียนรู้ของเครื่อง

นี่คือจุดที่การเรียนรู้การเสริมแรงเข้ามาอัลกอริทึม RL ล้วนเกี่ยวกับการปรับให้เหมาะสมสำหรับการเดินทางที่แฉและเปลี่ยนแปลงตลอดเวลาซึ่งเป็นปัญหาที่เกิดขึ้นแบบไดนามิก ด้วยการใช้ฟังก์ชัน“ รางวัลฟังก์ชั่นทางคณิตศาสตร์” เพื่อคำนวณผลลัพธ์ของการเปลี่ยนแปลงแต่ละครั้ง RL สามารถมองเห็นอนาคตและโทรออกได้อย่างถูกต้อง

วันนี้ศูนย์รวมที่ดีที่สุดของเทคโนโลยีที่ทันสมัยนี้สามารถพบได้ในเกมและรถยนต์ที่ขับเคลื่อนด้วยตนเอง เมื่อระบบ AlphaGo ของ Google เอาชนะผู้เล่นที่ดีที่สุดของเกมกระดานในปีที่แล้วซอสสูตรลับของพวกเขาคือการเสริมแรงการเรียนรู้ ในขณะที่เกมได้ตั้งกฎตัวเลือกของผู้เล่นสำหรับเส้นทางสู่ชัยชนะจะเปลี่ยนไปตามสภาพของบอร์ด ด้วยการเรียนรู้การเสริมแรงระบบบัญชีสำหรับการเปลี่ยนลำดับที่เป็นไปได้ทั้งหมดที่อาจมีการเปลี่ยนแปลงขึ้นอยู่กับการย้ายแต่ละครั้งต่อไป

ในทำนองเดียวกันรถยนต์ที่ขับด้วยตนเองไปในการเดินทางซึ่งกฎของถนนและที่ตั้งของปลายทางยังคงอยู่ แต่ตัวแปรตามทาง - จากคนเดินเท้าไปยังถนนและนักปั่นจักรยาน - เปลี่ยนแบบไดนามิก นั่นเป็นเหตุผลว่าทำไม OpenAI ซึ่งเป็นองค์กรที่ก่อตั้งโดย Elon Musk ของ Tesla ใช้อัลกอริธึม RL ขั้นสูงสำหรับยานพาหนะ

ไม่มีข้อบกพร่องไม่มีความเครียด - คู่มือแบบเป็นขั้นตอนเพื่อสร้างซอฟต์แวร์ที่เปลี่ยนแปลงชีวิตโดยไม่ทำลายชีวิตของคุณ

คุณไม่สามารถพัฒนาทักษะการเขียนโปรแกรมของคุณเมื่อไม่มีใครใส่ใจคุณภาพของซอฟต์แวร์

เครื่องจักรสำหรับนักการตลาด

สิ่งนี้หมายความว่าอย่างไรสำหรับนักการตลาด?

ความท้าทายหลักของนักการตลาดหลายคนเกิดขึ้นจากความจริงที่ว่าสภาพธุรกิจเปลี่ยนแปลงตลอดเวลา กลยุทธ์แคมเปญที่ชนะจะไม่เป็นที่พอใจเมื่อเวลาผ่านไปในขณะที่กลยุทธ์เก่า ๆ นั้นสามารถดึงขึ้นมาใหม่ได้ RL เป็นขั้นตอนในการเลียนแบบสติปัญญาของมนุษย์อย่างแท้จริงที่เราเรียนรู้จากความสำเร็จและ / หรือความล้มเหลวของผลลัพธ์ที่หลากหลายและสร้างกลยุทธ์ที่ชนะในอนาคต ขอยกตัวอย่าง:

1. การปรับปรุงการมีส่วนร่วมของผู้ใช้

มามุ่งเน้นที่การมีส่วนร่วมของลูกค้าในการสร้างเครือข่ายร้านอาหารและมีเป้าหมายที่จะเพิ่มขึ้นเป็นสิบเท่าในปีหน้า วันนี้แคมเปญการตลาดอาจเกี่ยวข้องกับคำอวยพรวันเกิดพร้อมข้อเสนอส่วนลดบางทีอาจเป็นไปตามความต้องการด้านอาหาร นี่คือการคิดเชิงเส้นที่นักการตลาดได้กำหนดจุดเริ่มต้นและจุดสิ้นสุด

ในโลกที่วุ่นวายชีวิตของลูกค้ามีการเปลี่ยนแปลงตลอดเวลาในแบบเรียลไทม์ - บางครั้งพวกเขาก็มีส่วนร่วมมากขึ้นและบางครั้งก็น้อยลง ในการเรียนรู้การเสริมแรงระบบจะทำการปรับเทียบอย่างต่อเนื่องว่ากลยุทธ์ใดในคลังอาวุธการตลาดในเวลาใดก็ตามเป็นโอกาสที่ดีที่สุดในการเคลื่อนย้ายผู้รับไปสู่เป้าหมายสูงสุดของการมีส่วนร่วม 10 เท่า

2. การจัดสรรงบประมาณแบบไดนามิก

ตอนนี้ลองนึกภาพสถานการณ์การโฆษณาที่คุณมีงบประมาณ $ 1 ล้านและต้องใช้จ่ายทุกวันจนถึงสิ้นเดือนจัดสรรผ่านช่องทางต่าง ๆ สี่ช่อง: ทีวีโปรโมตความภักดีและ Google คุณจะมั่นใจได้อย่างไรว่าคุณใช้งบประมาณอย่างคุ้มค่าที่สุด? คำตอบขึ้นอยู่กับวันผู้ใช้เป้าหมายราคาสินค้าคงคลังและโฮสต์ของปัจจัยอื่น ๆ

ในการเรียนรู้การเสริมแรงอัลกอริทึมจะใช้ข้อมูลผลลัพธ์โฆษณาย้อนหลังเพื่อเขียนฟังก์ชั่นการให้รางวัลซึ่งให้คะแนนการตัดสินใจใช้จ่ายบางอย่าง แต่ก็รวมถึงปัจจัยแบบเรียลไทม์เช่นการกำหนดราคาและโอกาสในการได้รับการตอบรับที่ดีจากสมาชิกกลุ่มเป้าหมาย ด้วยการเรียนรู้อย่างซ้ำ ๆ การจัดสรรการใช้จ่ายโฆษณาตลอดทั้งเดือนจะเปลี่ยนแปลงแบบไดนามิก แม้ว่าเป้าหมายสูงสุดจะถูกกำหนดไว้ RL จะจัดสรรงบประมาณในวิธีที่ดีที่สุดเท่าที่จะทำได้ในทุกสถานการณ์ (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ AI ในด้านการตลาดโปรดดูที่ปัญญาประดิษฐ์จะปฏิวัติอุตสาหกรรมการขายอย่างไร)

เร็ว ๆ นี้

การเรียนรู้การเสริมแรงรับรู้ถึงความซับซ้อนและตระหนักว่าผู้คนมีความแตกต่างและคำนึงถึงความจริงเหล่านี้ปรับปรุงการดำเนินการต่อไปในแต่ละช่วงเวลาเมื่อชิ้นส่วนของบอร์ดเกมของคุณเปลี่ยนไป

การเรียนรู้การเสริมแรงนั้นส่วนใหญ่ยังคงรักษาโครงการวิจัยและผู้ใช้งานระดับแนวหน้า แนวคิดและเทคนิคทางคณิตศาสตร์มีมานานกว่า 40 ปีแล้ว แต่ไม่สามารถนำไปใช้งานได้จนกระทั่งเมื่อไม่นานมานี้ด้วยแนวโน้มสามประการ:

การแพร่กระจายของพลังการประมวลผลผ่านหน่วยประมวลผลกราฟิกพลังสูง (GPU)
การประมวลผลแบบคลาวด์ทำให้โปรเซสเซอร์พลังงานระดับไฮเอนด์มีค่าใช้จ่ายเพียงเศษเสี้ยวของการซื้อ GPUs เองทำให้บุคคลที่สามสามารถเช่า GPU เพื่อฝึกอบรมโมเดล RL ของพวกเขาเป็นเวลาหลายชั่วโมงวันหรือสัปดาห์ในราคาที่ค่อนข้างต่อรอง
การปรับปรุงในอัลกอริธึมเชิงตัวเลขหรือการวิเคราะห์พฤติกรรมแบบสมาร์ท ขั้นตอนเชิงตัวเลขที่สำคัญสองสามขั้นตอนใน RL สามารถมาบรรจบกันได้เร็วกว่ามาก หากไม่มีเทคนิคเชิงตัวเลขที่น่าอัศจรรย์พวกเขาก็ยังไม่สามารถทำได้แม้จะมีคอมพิวเตอร์ที่ทรงพลังที่สุดในปัจจุบัน

กำลังคิดที่ใหญ่กว่า

ทั้งหมดนี้หมายถึงพลังใหม่ของการเรียนรู้การเสริมกำลังในไม่ช้าจะมีให้กับแบรนด์และนักการตลาด อย่างไรก็ตามการกอดมันจะต้องเปลี่ยนความคิด สำหรับผู้จัดการฝ่ายการตลาดเทคโนโลยีนี้หมายถึงความสามารถในการแยกมือออกจากวงล้อ

ทุกธุรกิจมีเป้าหมาย แต่เมื่อคุณลึกลงไปในสนามเพลาะการกระทำประจำวันที่มุ่งสู่เป้าหมายนั้นอาจกลายเป็นคลุมเครือ ตอนนี้เทคโนโลยี RL จะช่วยให้ผู้มีอำนาจตัดสินใจกำหนดเป้าหมายมีความมั่นใจมากขึ้นว่าระบบจะวางแผนเส้นทางที่ดีที่สุด

ตัวอย่างเช่นในการโฆษณาวันนี้หลายคนตระหนักว่าการวัดเช่นอัตราการคลิกผ่าน (CTR) เป็นเพียงผู้รับมอบอำนาจสำหรับผลลัพธ์ทางธุรกิจที่แท้จริงเท่านั้นที่นับได้เพราะนับได้เท่านั้น ระบบการตลาดที่ขับเคลื่อนด้วย RL จะไม่เน้นตัวชี้วัดของคนกลางและการยกที่เกี่ยวข้องกับพวกมันทำให้ผู้บังคับบัญชาสามารถมุ่งเน้นไปที่วัตถุประสงค์

สิ่งนี้จะทำให้ธุรกิจต้องพิจารณาปัญหาใหญ่ ๆ ของพวกเขาในเชิงรุกและระยะยาว เมื่อเทคโนโลยีเติบโตเต็มที่พวกเขาจะบรรลุเป้าหมาย

เส้นทางไปสู่การยอมรับ

การเรียนรู้การเสริมแรงยังไม่พร้อมสำหรับการใช้อย่างเต็มรูปแบบโดยแบรนด์ต่างๆ อย่างไรก็ตามนักการตลาดควรใช้เวลาในการทำความเข้าใจแนวคิดใหม่นี้ที่สามารถปฏิวัติวิธีการทำตลาดของแบรนด์ทำให้ดีในบางส่วนของสัญญาเริ่มต้นของการเรียนรู้ของเครื่อง

เมื่อกระแสไฟฟ้ามาถึงจะมีซอฟต์แวร์ทางการตลาดพร้อมส่วนต่อประสานกับผู้ใช้ แต่งานที่ต้องการโดยซอฟต์แวร์นั้นจะง่ายขึ้นอย่างมาก สำหรับพนักงานจะมีสวิตช์ที่เคลื่อนไหวน้อยลงและป้อนตัวเลขรวมถึงรายงานการวิเคราะห์การอ่านน้อยลงและดำเนินการกับพวกเขา ด้านหลังแผงควบคุมอัลกอริทึมจะจัดการส่วนใหญ่นั้น

ไม่น่าเป็นไปได้ที่ RL สามารถจับคู่ความฉลาดของมนุษย์ออกไปนอกประตูได้ ความเร็วในการพัฒนาขึ้นอยู่กับความคิดเห็นและข้อเสนอแนะจากนักการตลาด เราต้องตรวจสอบให้แน่ใจว่าเรากำลังขอให้คอมพิวเตอร์แก้ไขปัญหาที่ถูกต้องและลงโทษหากไม่ได้รับการแก้ไข ดูเหมือนว่าคุณจะสอนลูกของคุณเองใช่ไหม?