โพสต์นี้เป็นเรื่องเกี่ยวกับโครงการสุดยอดนักวิทยาศาสตร์ข้อมูล Udacity Data Nanodegree เราเลือกโครงการส่งเสริมการขายสตาร์บัคส์

ภาพรวมโครงการ

โปรโมชั่นช่วยในการสร้างการรับรู้ถึงแบรนด์ เพิ่มจำนวนลูกค้า และสร้างยอดขายและผลกำไร กลยุทธ์การส่งเสริมการขายมีความสำคัญแต่ก็ท้าทายมาก ธุรกิจจะต้องคำนึงถึงหลายแง่มุมของแผนการตลาดของตน ตัวอย่างเช่น ด้วยงบประมาณที่จำกัด จึงจำเป็นอย่างยิ่งที่จะต้องใช้สื่อที่เหมาะสมเพื่อส่งข้อเสนอส่งเสริมการขายไปยังลูกค้าที่เหมาะสม การส่งโปรโมชั่นให้กับลูกค้าผิดหรือช่องทางที่ไม่ถูกต้องจะทำให้ต้นทุนทางธุรกิจเพิ่มขึ้นโดยมีผลกระทบต่อรายได้ทางธุรกิจเพียงเล็กน้อยหรือไม่มีเลย

ในฐานะส่วนหนึ่งของโครงการ Udacity Data Scientists Nanodegree Captone ทาง Starbucks ได้กรุณาจัดเตรียมชุดข้อมูลส่งเสริมการขายจำลองที่เลียนแบบพฤติกรรมของลูกค้าในแอปมือถือที่มีรางวัล โปรโมชั่นดำเนินไปดังนี้: ทุกๆ สองสามวัน Starbucks จะส่งข้อเสนอส่งเสริมการขายให้กับลูกค้า โปรโมชั่นอาจเป็นข้อเสนอส่วนลด ข้อเสนอซื้อหนึ่งแถมหนึ่ง (bogo) หรือข้อเสนอที่ให้ข้อมูล ลูกค้าแต่ละรายอาจตอบสนองต่อข้อเสนอเหล่านี้แตกต่างกัน ตัวอย่างเช่น ลูกค้าบางรายจะตอบรับโปรโมชั่นในเชิงบวก พวกเขาจะดูข้อเสนอและสั่งซื้อในภายหลัง ในทางกลับกันลูกค้าบางรายอาจเพิกเฉยต่อโปรโมชั่น พวกเขาอาจไม่เคยสั่งซื้อเลยหลังจากดูโปรโมชั่น หรืออาจสั่งซื้อโดยไม่ได้สังเกตเห็นโปรโมชั่นด้วยซ้ำ เนื่องจากมีต้นทุนที่เกี่ยวข้องกับข้อเสนอส่งเสริมการขาย การวิเคราะห์ข้อมูลจึงอาจเป็นประโยชน์ในการทำความเข้าใจพฤติกรรมของลูกค้า การตัดสินใจทางธุรกิจอย่างชาญฉลาด และการใช้กลยุทธ์เพื่อปรับปรุงผลกำไรทางธุรกิจ

คำชี้แจงปัญหา

ในการวิเคราะห์นี้ เราสนใจคำถามต่อไปนี้:

· ข้อมูลประชากรของลูกค้าคืออะไร?

· เพศต่างๆ ตอบสนองต่อโปรโมชั่นแตกต่างกันอย่างไร?

· ช่องทางใดที่ดีที่สุดในการส่งโปรโมชั่น?

· เราสามารถสร้างแบบจำลองเพื่อคาดการณ์พฤติกรรมของลูกค้าและส่งข้อเสนอส่งเสริมการขายที่กำหนดเองให้กับแต่ละบุคคลได้หรือไม่?

เมตริก

· สำหรับการวิเคราะห์ข้อมูลประชากรของลูกค้า เราสนใจที่จะแจกแจงอายุ รายได้ และสถานะสมาชิก (จำนวนวันนับตั้งแต่เป็นสมาชิก)

· เพื่อทำความเข้าใจว่าลูกค้าแต่ละรายตอบสนองต่อข้อเสนอต่างๆ ที่แตกต่างกันอย่างไร เราจึงคำนวณข้อเสนอที่ส่งมอบ ดูข้อเสนอ และข้อเสนอที่เสร็จสมบูรณ์ภายใต้สถานการณ์ต่างๆ เนื่องจากกลุ่มต่างๆ อาจได้รับข้อเสนอในจำนวนที่แตกต่างกัน เราจึงแนะนำอัตราส่วนปกติสามประการ: ดู/ส่งแล้ว เสร็จสมบูรณ์/ดู และเสร็จสมบูรณ์/ส่งแล้ว เพื่อเปรียบเทียบประสิทธิภาพของข้อเสนอสำหรับลูกค้าที่หลากหลายและช่องทางการส่งมอบข้อเสนอ

· เราแนะนำตัวชี้วัดใหม่ “ความสำเร็จ” เพื่อติดป้ายกำกับประสิทธิภาพของข้อเสนอ หากลูกค้าส่งมอบ ดู และดำเนินการให้เสร็จสิ้น เหตุการณ์ "ความสำเร็จ" จะถูกระบุว่าเป็น True หากมีการส่งมอบข้อเสนอแต่ไม่เคยเสร็จสมบูรณ์ หรือเสร็จสมบูรณ์โดยที่ลูกค้าไม่ได้ดู เหตุการณ์ "ความสำเร็จ" จะถูกระบุว่าเป็นเท็จ โมเดล ML ของเราจะใช้ในการจำแนกเหตุการณ์ "ความสำเร็จ" คะแนนความแม่นยำของอัลกอริทึม ML จะถูกรายงาน

การสำรวจข้อมูล

ชุดข้อมูลประกอบด้วยสามไฟล์:

1. ไฟล์portfolio.jsonประกอบด้วยรหัสข้อเสนอและข้อมูลเมตาเกี่ยวกับข้อเสนอแต่ละรายการ เช่น รางวัล ช่องสื่อ ความยาก ระยะเวลา มีข้อเสนอส่งเสริมการขาย 10 รายการซึ่งแบ่งออกเป็นสามประเภท (bogo ส่วนลด และโปรโมชั่น) ไม่มีข้อมูล NA ในชุดข้อมูล

2. ไฟล์profile.jsonประกอบด้วยข้อมูลประชากรของลูกค้าแต่ละราย รวมถึงเพศ อายุ รายได้ และสถานะการเป็นสมาชิก มีลูกค้าประมาณ 17,000 รายในโปรไฟล์ ในจำนวนนี้มีลูกค้าประมาณ 12.79 รายที่ไม่ได้ระบุข้อมูลเพศ อายุ และรายได้ คอลัมน์เพศและรายได้ของลูกค้าเหล่านี้เต็มไปด้วย NA ในขณะที่คอลัมน์อายุของลูกค้าเหล่านี้เต็มไปด้วย 118

3. ไฟล์ transcript.json มีบันทึกสำหรับธุรกรรม รหัสบุคคล รหัสข้อเสนอ และกิจกรรม เหตุการณ์ประกอบด้วยข้อมูลหมวดหมู่ซึ่งรวมถึงข้อเสนอที่ได้รับ ข้อเสนอที่ดู ธุรกรรม และข้อเสนอที่เสร็จสมบูรณ์ มีบันทึกประมาณ 306K ในไฟล์ ไม่มีข้อมูล NA ในชุดข้อมูล

การแสดงข้อมูล

ส่วนที่ 1 ข้อมูลประชากรของลูกค้าคืออะไร

มีลูกค้าประมาณ 17,000 รายในข้อมูลโปรไฟล์ ในจำนวนนี้ ลูกค้าประมาณ 12.79% ไม่ได้ระบุข้อมูลเพศ อายุ และรายได้ เนื่องจากคุณลักษณะเหล่านี้จะเป็นอินพุตสำคัญของแบบจำลองการคาดการณ์ในอนาคต เราจึงตัดสินใจตัดลูกค้าเหล่านี้ออกจากการวิเคราะห์ข้อมูล ลูกค้าที่เหลือระบุว่าเป็นผู้ชาย (57.3%) ผู้หญิง (41.3%) และอื่นๆ (1.4%) การกระจายอายุ รายได้ และจำนวนวันของลูกค้านับตั้งแต่เป็นสมาชิกแสดงไว้ดังรูปต่อไปนี้ แผนภูมิความหนาแน่นถูกจัดกลุ่มตามเพศ โปรดทราบว่ากลุ่มอายุของลูกค้าจะอยู่ที่ประมาณ 50 ปี ซึ่งเกือบจะกระจายตามปกติ ยกเว้นกลุ่มเล็กๆ สำหรับผู้ชายที่อายุ 25 ปี มีชายหนุ่มมากกว่าหญิงสาวที่ยินดีเข้าร่วมโปรแกรมสมาชิกสตาร์บัคส์ การกระจายรายได้ของกลุ่มเพศก็แตกต่างกันเช่นกัน ดังที่แสดงในรูปตรงกลาง รายได้เฉลี่ยของลูกค้าคือ ~55K สำหรับผู้หญิงและ ~75K สำหรับผู้ชาย ความหนาแน่นของวันสมาชิกที่แตกต่างกันระหว่างเพศต่างๆ นั้นไม่มีนัยสำคัญ โดยมีจุดสูงสุดประมาณ 1,600 วัน

ส่วนที่ 2 ลูกค้าต่างๆ ตอบสนองต่อโปรโมชันแตกต่างกันอย่างไร

ข้อเสนอมีสามประเภท: bogo ส่วนลด และให้ข้อมูล หลังจากส่งข้อเสนอเหล่านี้แล้ว ลูกค้าอาจดำเนินการอย่างใดอย่างหนึ่งหรือหลายอย่างต่อไปนี้: ได้รับข้อเสนอ ดูข้อเสนอ และข้อเสนอเสร็จสมบูรณ์ เนื่องจากประเภทข้อเสนอ "ที่ให้ข้อมูล" ไม่มีการดำเนินการ "ข้อเสนอที่เสร็จสมบูรณ์" ที่เกี่ยวข้อง เราจึงลบออกจากการวิเคราะห์บางส่วนในอนาคต คำถามแรกของเราที่จะถามคือระหว่างข้อเสนอ bogo และส่วนลด อันไหนได้รับความนิยมมากกว่ากัน ดังแสดงในรูปต่อไปนี้ ข้อเสนอทั้งสองถูกส่งออกไปเกือบเท่าๆ กัน แม้ว่าข้อเสนอ Bogo จะได้รับการตรวจสอบมากกว่าข้อเสนอส่วนลด แต่ข้อเสนอส่วนลดก็เสร็จสมบูรณ์มากขึ้น

อีกคำถามหนึ่งที่เราอยากถามคือ เพศที่แตกต่างกันตอบสนองต่อข้อเสนออย่างไร ดังที่แสดงในรูปต่อไปนี้ เป็นเรื่องน่าสนใจมากที่จะสังเกตว่าถึงแม้ข้อเสนอจำนวนมากจะถูกส่งไปยังผู้ชาย และข้อเสนออื่นๆ อีกมากมายถูกมองโดยผู้ชาย แต่มีผู้ชายเพียงส่วนน้อยเท่านั้นที่ทำข้อเสนอให้เสร็จสิ้น กล่าวอีกนัยหนึ่ง ผู้หญิงมีแนวโน้มที่จะปฏิบัติตามข้อเสนอมากกว่าผู้ชาย แม้ว่าจะมีจำนวนข้อเสนอที่ส่งถึงผู้หญิงน้อยกว่าก็ตาม

เนื่องจากข้อเสนอที่ส่งไปยังกลุ่มต่างๆ อาจแตกต่างกัน จึงเป็นสิ่งสำคัญในการคำนวณอัตราการสำเร็จเพื่อประเมินประสิทธิภาพของข้อเสนอ ต่อไปนี้ เราจะคำนวณการวัดใหม่สามรายการ: ดู/รับแล้ว เสร็จสมบูรณ์/ดู และเสร็จสมบูรณ์/รับแล้ว ในที่นี้ อัตราส่วนการดู/รับแสดงถึงความน่าดึงดูดของข้อเสนอตั้งแต่แรกเห็น ส่งผลให้ลูกค้าเต็มใจที่จะดูข้อเสนอ อัตราส่วนที่เสร็จสมบูรณ์/ดู และเสร็จสมบูรณ์/ได้รับ แสดงให้เห็นว่าข้อเสนอมีประสิทธิภาพเพียงใด และลูกค้าเต็มใจที่จะใช้หรือไม่ โปรดทราบว่าลูกค้าบางรายอาจดำเนินการตามข้อเสนอโดยไม่ได้สังเกตเห็น (หรือดู) ข้อเสนอดังกล่าวด้วยซ้ำ ซึ่งบ่งชี้ว่าข้อเสนอดังกล่าวไม่มีผลกับลูกค้ารายนี้โดยเฉพาะ

ตารางอัตราส่วนความสมบูรณ์และแปลงแสดงอยู่ในรูปต่อไปนี้ ข้อมูลนี้ยังยืนยันข้อสรุปก่อนหน้านี้ของเรา: ข้อเสนอส่วนลดมีประสิทธิภาพมากกว่าข้อเสนอ Bogo ทั้งอัตราส่วนที่เสร็จสมบูรณ์/ได้รับ และอัตราส่วนที่เสร็จสมบูรณ์/ดูสำหรับข้อเสนอส่วนลดนั้นใหญ่กว่าข้อเสนอ Bogo มาก หากเปรียบเทียบตามเพศ ลูกค้าผู้หญิงจะมีอัตราส่วนการรับชม/รับชมที่เสร็จสมบูรณ์/ดูมากกว่าลูกค้าผู้ชายมาก

นอกจากนี้เรายังสามารถเจาะลึกลงไปอีกเพื่อทำความเข้าใจว่าเพศ + ข้อเสนอประเภทต่างๆ อาจส่งผลต่ออัตราส่วนความสำเร็จอย่างไร สิ่งที่น่าสนใจคือลูกค้าผู้หญิงออกกำลังกายมากกว่าลูกค้าผู้ชายสำหรับข้อเสนอทุกประเภท สำหรับกรณีของข้อเสนอ bogo อัตราส่วนที่เสร็จสมบูรณ์/ได้รับคือ 68.3% สำหรับผู้หญิง และ 49.4% สำหรับผู้ชาย สำหรับข้อเสนอส่วนลด อัตราส่วนที่เสร็จสมบูรณ์/ได้รับคือ 72.9% สำหรับผู้หญิง และ 68.3% สำหรับผู้ชาย

ข้อเสนอสามารถส่งผ่านช่องทางต่างๆ เช่น เว็บ อีเมล มือถือ และโซเชียล ลูกค้าแต่ละรายอาจรับรู้ข้อเสนอที่แตกต่างกันผ่านช่องทางต่างๆ ที่นี่ เราได้จัดกลุ่มใบรับรองผลการเรียนทั้งหมดตามประเภทข้อเสนอและช่องทางการนำเสนอ และเปรียบเทียบอัตราส่วนที่เสร็จสมบูรณ์/ได้รับตามเพศชาย/เพศหญิง ดังที่แสดงในรูปและตารางต่อไปนี้ ในทุกสถานการณ์ ผู้หญิงตอบสนองต่อข้อเสนอเชิงบวกมากกว่าผู้ชาย โดยจะเห็นได้จากอัตราส่วนความสำเร็จที่สูงกว่า เป็นที่น่าสนใจที่จะทราบว่าผู้หญิงตอบสนองต่อข้อเสนอส่วนลดที่ส่งมาจากโซเชียลมีเดียมากที่สุดโดยมีอัตราส่วนการสำเร็จที่ ~81.7% ในขณะที่ผู้ชายจะตอบสนองต่อข้อเสนอส่วนลดที่ส่งมาจากโซเชียลมีเดียน้อยที่สุดโดยมีอัตราส่วนการสำเร็จที่ ~47.4% ข้อสรุปชัดเจนมาก: เมื่อมีงบประมาณจำกัด ให้ส่งข้อเสนอส่วนลดให้กับผู้หญิงผ่านโซเชียลมีเดีย แทนที่จะส่งข้อเสนอ Bogo ให้กับผู้ชายผ่านช่องทางโซเชียล

การประมวลผลข้อมูลล่วงหน้า

1. ข้อมูลพอร์ตโฟลิโอ: ข้อมูลพอร์ตโฟลิโอมีสองคอลัมน์ที่ต้องการการเข้ารหัสแบบร้อนแรงเดียว คอลัมน์ช่องประกอบด้วยเว็บ อีเมล อุปกรณ์เคลื่อนที่ และโซเชียล คอลัมน์ offer_type ประกอบด้วยประเภท bogo ข้อมูล และส่วนลด

2. ข้อมูลโปรไฟล์: มีลูกค้าประมาณ 12.79% ที่ไม่ได้ระบุข้อมูลเพศ รายได้ และอายุ ลูกค้าเหล่านี้จะถูกลบออกจากโมเดลของเรา คอลัมน์ Become_member_on ถูกใช้เพื่อคำนวณคุณลักษณะเพิ่มเติมอีกสองประการ ได้แก่ วันสมาชิกแสดงถึงจำนวนวันทั้งหมดหลังจากที่ลูกค้าสมัครสมาชิก year_join หมายถึงปีที่ลูกค้าสมัครสมาชิก

3. ข้อมูลการถอดเสียง: คอลัมน์ค่าจะถูกคลายแพ็กเพื่อแยกค่า offer_id คอลัมน์เหตุการณ์จะถูกเข้ารหัสแบบร้อนแรง และคอลัมน์ใหม่สามคอลัมน์: ข้อเสนอที่ได้รับ ข้อเสนอที่ดู และข้อเสนอที่เสร็จสมบูรณ์จะถูกเพิ่มลงในดาต้าเฟรม

4. ป้ายกำกับ "ความสำเร็จ" คำนวณตามเกณฑ์ต่อไปนี้: หากมีการส่งมอบ ดู และดำเนินการข้อเสนอให้เสร็จสิ้น ป้ายกำกับความสำเร็จจะเป็น True หากข้อเสนอไม่เสร็จสมบูรณ์ หรือหากเสร็จสมบูรณ์แต่ไม่ได้ดู ป้ายกำกับความสำเร็จจะเป็นเท็จ

5. ชุดข้อมูลที่ครอบคลุมซึ่งใช้ข้อมูลพอร์ตโฟลิโอ โปรไฟล์ ใบรับรองผลการเรียน และป้ายกำกับที่รวบรวมไว้สำหรับแนวทาง ML

การนำไปปฏิบัติ

จากการวิเคราะห์ข้างต้น เราพบว่ามีหลายปัจจัยที่ส่งผลต่อพฤติกรรมของลูกค้าและประสิทธิภาพของข้อเสนอส่งเสริมการขาย เราได้แสดงให้เห็นว่าเพศ ประเภทข้อเสนอ และช่องทางการส่งมอบข้อเสนอล้วนส่งผลต่ออัตราการสำเร็จข้อเสนอ มีปัจจัยอื่นๆ อีกมากมาย เช่น รายได้และจำนวนวันสมาชิกของลูกค้า รางวัลของข้อเสนอและความยากลำบากที่อาจส่งผลต่อประสิทธิภาพของข้อเสนอ การสร้างแบบจำลองการคาดการณ์เพื่อคาดการณ์พฤติกรรมของลูกค้าจะเป็นประโยชน์

ความมีประสิทธิผลของข้อเสนอจะถูกระบุจากการกระทำของลูกค้าหลังจากที่พวกเขาได้รับข้อเสนอ สร้างคอลัมน์ "ความสำเร็จ" ใหม่แล้ว หากลูกค้าได้รับข้อเสนอ ดูข้อเสนอ และดำเนินการให้เสร็จสิ้นในภายหลัง คอลัมน์ "ความสำเร็จ" จะมีป้ายกำกับว่า "ใช่" ในอีกด้านหนึ่ง หากลูกค้าได้รับข้อเสนอแต่ไม่ดำเนินการให้เสร็จสิ้น หรือเขา/เธอทำข้อเสนอให้เสร็จสิ้นโดยไม่ได้ดูด้วยซ้ำ คอลัมน์ "ความสำเร็จ" จะมีป้ายกำกับว่า "ไม่" จากชุดข้อมูลทั้งหมด การสังเกต 42.6% มีป้ายกำกับว่าใช่ และการสังเกต 57.4% มีป้ายกำกับว่าไม่ใช่ ข้อมูลอยู่ในสมดุลที่ดี

คุณสมบัติต่อไปนี้ใช้เพื่อสร้างแบบจำลองการทำนาย: 'อายุ', 'รายได้', 'วันสมาชิก', 'F', 'M', 'O', 'รางวัล', 'ความยาก', 'ระยะเวลา', 'เว็บ' , 'มือถือ', 'โซเชียล', 'bogo', 'ส่วนลด', 'ข้อมูล' เหตุผลที่เราลบ “อีเมล” ออกจากรายการตัวทำนายของเราก็เนื่องมาจากช่องทางอีเมลถูกนำเสนอในการสังเกตทั้งหมด

ชุดข้อมูลถูกแบ่งออกเป็นชุดข้อมูลการฝึกอบรมและการทดสอบ ในตอนแรก เราได้ทดสอบตัวแยกประเภทสี่ตัว (LogisticRegression, RandomForestClassifier, GradientBoostingClassifier, KNeighborsClassifier) ​​เพื่อประเมินประสิทธิภาพของตัวแยกประเภทที่แตกต่างกัน สำหรับตัวแยกประเภทแต่ละตัว เราใช้พารามิเตอร์การปรับเริ่มต้นเพื่อให้พอดีกับข้อมูลการฝึก คำนวณความแม่นยำของทั้งชุดข้อมูลการฝึกและการทดสอบ ผลลัพธ์จะแสดงดังต่อไปนี้: (รายละเอียด)

· LogisticRegression: ความแม่นยำในการฝึก: 0.611, ความแม่นยำในการทดสอบ: 0.618

· RandomForestClassifier: ความแม่นยำในการฝึก: 1.000, ความแม่นยำในการทดสอบ: 0.741

· GradientBoostingClassifier: ความแม่นยำในการฝึก: 0.770, ความแม่นยำในการทดสอบ: 0.765

· KNeighborsClassifier: ความแม่นยำในการฝึก: 0.760, ความแม่นยำในการทดสอบ: 0.620

ดังที่แสดงไว้ข้างต้น ทั้งตัวแยกประเภท Logistic และตัวแยกประเภท KNN มีความแม่นยำในการทดสอบค่อนข้างต่ำ ตัวแยกประเภทฟอเรสต์แบบสุ่มมีคะแนนการฝึกอบรมและการทดสอบที่แตกต่างกัน ซึ่งบ่งชี้ว่าแบบจำลองมีปัญหาในการติดตั้งมากเกินไป เราจะเลือก Gradient Boosting Classifier เพื่อการปรับแต่งเพิ่มเติม

การปรับแต่ง การประเมิน และการตรวจสอบความถูกต้อง

ตัวปรับขนาดขั้นต่ำ-สูงสุดถูกใช้เพื่อแปลงคุณสมบัติในระหว่างกระบวนการปรับแต่งโมเดลตัวแยกประเภทการเร่งความเร็วแบบไล่ระดับสี ไปป์ไลน์ถูกสร้างขึ้นเพื่อให้เหมาะสมและตรวจสอบแบบจำลอง พารามิเตอร์การค้นหาตารางถูกสร้างขึ้นด้วย n_estimators = [100, 120, 140] และ min_sample_split=[2, 3] พารามิเตอร์ที่ดีที่สุดจากการค้นหากริดคือ n_estimators=140 และ min_sample_split=2 ด้วยโมเดลที่ได้รับการปรับแต่งอย่างละเอียด เราจึงมีความแม่นยำในการฝึกอยู่ที่ 0.773 และความแม่นยำในการทดสอบอยู่ที่ 0.767 ค่าจะสูงกว่าคะแนนที่ได้รับจากโมเดลที่มีพารามิเตอร์การฝึกเริ่มต้นเล็กน้อย (ความแม่นยำในการฝึก: 0.770, ความแม่นยำในการทดสอบ: 0.765) (รายละเอียด)

การให้เหตุผล การสะท้อนกลับ และการนำไปปฏิบัติต่อไป

ในบทความนี้ เราได้สำรวจการกระจายโปรไฟล์ลูกค้า เรายังสำรวจเพิ่มเติมว่าลูกค้าต่างๆ ตอบสนองต่อข้อเสนอที่แตกต่างกันอย่างไร เห็นได้ชัดว่าไม่ควรส่งข้อเสนอแบบสุ่มสี่สุ่มห้า เนื่องจากลูกค้าที่แตกต่างกันตอบสนองต่อประเภทข้อเสนอและช่องทางการส่งมอบข้อเสนอโดยเฉพาะ มีข้อสรุปที่สำคัญสามประการ:

1) ได้รับข้อเสนอส่วนลดดีกว่าข้อเสนอ Bogo

2)ผู้หญิงตอบสนองได้ดีกว่าผู้ชายมาก

3) การโปรโมตผ่านโซเชียลมีเดียมีประสิทธิภาพมากกว่าช่องทางอื่นๆ

นอกจากนี้เรายังสร้างแบบจำลองการคาดการณ์ซึ่งสามารถจำแนกประสิทธิภาพของข้อเสนอได้ สมมติว่าเราไม่มีแบบจำลองการคาดการณ์ และเราจะส่งข้อเสนอให้กับลูกค้าทั้งหมด จากการสังเกตทั้งหมด 42.6% ถูกระบุว่าเป็น “จริง” คะแนนความแม่นยำในกรณีดังกล่าวจะเป็น 0.426 แบบจำลองที่เรานำไปใช้จะเพิ่มคะแนนความแม่นยำจาก 0.426 เป็น 0.767 ซึ่งเพิ่มขึ้นอย่างแน่นอน 34.1%

หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับการวิเคราะห์นี้ โปรดดูลิงก์ไปยัง Github ของฉันที่มีอยู่ ที่นี่