Want to make creations as awesome as this one?

Transcript

Tôi đã sẵn sàng!

Nhấp vào đây khi nào bạn đã sẵn sàng bắt đầu thử thách này

Điểm kiểm tra

Bạn là nhà khoa học dữ liệu làm việc tại Công ty Juicey, tập đoàn nước giải khát lớn thứ ba thế giới.
Một năm trước, công ty đã ra mắt JuiceyBox, một mô hình đăng ký nơi người tiêu dùng nhận sinh tố cá nhân hóa trực tiếp tại nhà hàng tháng.

TÌNH HUỐNG BỐI CẢNH 01

01

Juicey

Mặc dù JuiceyBox đã đạt thành công lớn, nhưng vẫn cần cải thiện hoạt động mới.

Bạn đang dẫn dắt nhóm khoa học dữ liệu và bạn cần giải thích cho các thành viên trong nhóm của mình hiểu thứ tự chính xác của các bước trong dự án khoa học dữ liệu là gì.

PHƯƠNG PHÁP KHOA HỌC DỮ LIỆU

Tiếp tục

Đặt các bước sau theo thứ tự thời gian của chúng:

3

2

1

4

5

6

7

8

9

Bạn có
đoán chính
xác không?

Kéo & thả các bước vào đúng vị trí của chúng trong dự án Khoa học Dữ liệu.

THU THẬP DỮ LIỆU

KHAI THÁC

HÀNH ĐỘNG

GIAO TIẾP

ĐÁNH GIÁ

LÀM SẠCH DỮ LIỆU

CẢI TIẾN PHẢN HỒI

MỤC TIÊU KINH DOANH

MÔ HÌNH HÓA

Tình huống 01

Tôi đã sai

Tôi đã đúng

3

2

1

4

5

6

7

8

9

Phân loại chính xác là:

LÀM SẠCH DỮ LIỆU

CẢI TIẾN PHẢN HỒI

MỤC TIÊU KINH DOANH

MÔ HÌNH HÓA

Tình huống 01

THU THẬP DỮ LIỆU

KHAI THÁC

HÀNH ĐỘNG

GIAO TIẾP

ĐÁNH GIÁ

RẤT TỐT!

Tình huống 01

Tiếp tục

Tiến hành một dự án khoa học dữ liệu dẫn bạn qua 9 bước:
1 - Mục tiêu kinh doanh - để có cái nhìn tổng quan đầy đủ về các vấn đề kinh doanh cần giải quyết
2 - Thu thập Dữ liệu - thô, có cấu trúc và không có cấu trúc, từ tất cả các nguồn có liên quan. Việc thu thập phải được nhắm đến một mục tiêu nhất định
3 - Làm sạch dữ liệu - để thống nhất cơ sở dữ liệu, vì chất lượng là rất quan trọng đối với mô hình
4 - Mô hình hóa và đào tạo - để mô hình học hỏi và cải thiện thông qua thực hành và chọn khung / phương pháp lập mô hình phù hợp
5 - Đánh giá - để chạy tốt nhất (chính xác nhất) mô hình so với toàn bộ tập dữ liệu
6 - Giao tiếp - để tiết lộ những hiểu biết sâu sắc và cho phép hiểu, thảo luận và đưa ra các quyết định liên quan đến công việc kinh doanh.
7 - Triển khai và áp dụng - Thách thức, diễn giải và thực hiện các kết quả
8 - Thực hiện các hành động dựa trên những hiểu biết sâu sắc - để tạo ra tác động kinh doanh.
9 - Phản hồi liên tục và cải tiến - phần quan trọng nhất - Để học hỏi và phát triển...

Ồ, hãy nhìn theo một góc độ khác nhé!

Tiếp tục

Toàn bộ nhóm khoa học dữ liệu của bạn được điều chỉnh theo các bước khác nhau của một dự án khoa học dữ liệu.
Các giám đốc tiếp thị đang liên hệ với bạn để giúp họ cải thiện hiệu suất của Juiceybox.
Sau đó, bạn bắt đầu bước đầu tiên của dự án khoa học dữ liệu của mình: Mục tiêu kinh doanh.

TÌNH HUỐNG BỐI CẢNH 02

02

MỤC TIÊU KINH DOANH

Juicey

Để bắt đầu xây dựng mô hình của mình, bạn chọn ngồi lại với các giám đốc tiếp thị để tìm hiểu họ đang gặp phải vấn đề gì với hiệu suất của đăng ký Juiceybox.

Họ chia sẻ với bạn một số thông tin.

Tiếp tục

🥥

"Chúng tôi cần hiểu những hành động nào khiến

người tiêu dùng của chúng tôi hủy đăng ký"

🍉


"Chúng tôi cần tăng tỷ lệ giữ chân người tiêu dùng lên 25%"

🍍


"Chúng tôi nhận được một số phản hồi rất tốt

về các sản phẩm trong gói đăng ký Juiceybox"

Tình huống 02

Là một nhà khoa học dữ liệu, bạn sẽ chọn xây dựng mô hình nào?

MỘT MÔ HÌNH ĐỂ CHẨN ĐOÁN VẤP NGÃ TRONG QUÁ TRÌNH BÁN HÀNG

MÔ HÌNH ĐỂ MÔ TẢ LỊCH SỬ BÁN HÀNG CỦA JUICEYBOX

MỘT MÔ HÌNH ĐỂ DỰ ĐOÁN KHẢ NĂNG NGƯNG SỬ DỤNG DỊCH VỤ CỦA NGƯỜI TIÊU DÙNG

MỘT MÔ HÌNH ĐỂ QUY ĐỊNH SẢN PHẨM JUICEY NÀO NÊN BÁN

RẤT TỐT!

Tình huống 02

Tiếp tục

Ồ, hãy nhìn theo một góc độ khác nhé!

Hiểu biết kinh doanh là bước đầu tiên và là một trong những bước quan trọng nhất của một dự án khoa học dữ liệu. Điều này sẽ cho phép bạn có một cái nhìn tổng quan đầy đủ, để giải quyết đúng vấn đề kinh doanh.
Bạn vừa chọn một giải pháp trong số 4 câu trả lời, tương ứng đề cập đến 4 cách tiếp cận của khoa học dữ liệu trong kinh doanh: Quy định, mô tả, dự đoán và chẩn đoán.
Bạn thực sự có thể quyết định xây dựng một mô hình nhằm mục đích mô tả những gì đã xảy ra trong quá khứ hoặc để chẩn đoán các mô hình của công ty. Tuy nhiên, vì tình huống này có thể phản ánh hoạt động kinh doanh, điều này sẽ không đáp ứng nhu cầu thiết lập một điểm số rời bỏ cho tương lai.
Bạn cũng có thể chọn xây dựng một mô hình chỉ định để xác định lựa chọn sản phẩm nào sẽ mang lại kết quả tốt nhất trong một tình huống nhất định, nhưng có thể hơi sớm, vì tại thời điểm này, bạn vẫn chưa có thông tin chi tiết về khách hàng nào có thể hủy đăng ký và lý do.
Hãy nhớ: "Hãy suy nghĩ kinh doanh về phía sau, không phải dữ liệu về phía trước." !
Vì những lý do đó, giải pháp tối ưu hơn ở giai đoạn này sẽ là tập trung vào cách tiếp cận dự đoán:
Do đó, với tư cách là một nhà khoa học dữ liệu, mục tiêu của bạn là thiết kế một mô hình dự đoán khả năng ngừng sử dụng dịch vụ đối với từng khách hàng.

Tiếp tục

Thu thập dữ liệu là thu thập dữ liệu nội bộ (bán hàng, sản phẩm, v.v.) và dữ liệu bên ngoài (thời tiết, dân số, v.v.) từ tất cả các nguồn có liên quan.
Bây giờ, bạn cần xác định dữ liệu phù hợp để mô hình của bạn phát triển!

TÌNH HUỐNG BỐI CẢNH 03

03

THU THẬP DỮ LIỆU

Juicey

Tình huống 03

Hãy xác định dữ liệu phù hợp cho mô hình của bạn!

DỮ LIỆU ĐÚNG

DỮ LIỆU SAI

Độ tuổi của người tiêu dùng hủy đăng ký trong vòng sáu tháng qua.

RẤT TỐT!

Tình huống 03

Tiếp tục

ĐÃ GẦN ĐÚNG RỒI!

Tình huống 03

Tiếp tục

Tình huống 03

Hãy xác định dữ liệu phù hợp cho mô hình của bạn!

DỮ LIỆU ĐÚNG

DỮ LIỆU SAI

Tỷ lệ bán rượu vang đỏ trên toàn thế giới của các đối thủ cạnh tranh của bạn.

RẤT TỐT!

Tình huống 03

Tiếp tục

ĐÃ GẦN ĐÚNG RỒI!


Tình huống 03

Tiếp tục

Tình huống 03

Hãy xác định dữ liệu phù hợp cho mô hình của bạn!

DỮ LIỆU ĐÚNG

DỮ LIỆU SAI

Lượng bán ra tăng trong thời gian Giáng sinh trong 3 năm qua.

RẤT TỐT!

Tình huống 03

Tiếp tục

ĐÃ GẦN ĐÚNG RỒI!

Tình huống 03

Tiếp tục

Thu thập dữ liệu là tập hợp dữ liệu nội bộ và dữ liệu bên ngoài từ tất cả các nguồn có liên quan. Khoa học dữ liệu phân biệt dữ liệu thô có cấu trúc với dữ liệu thô phi cấu trúc.
Trong số các lựa chọn phản hồi trước đó, dữ liệu tốt để thu thập cho mô hình của bạn là:
Độ tuổi của người tiêu dùng hủy đăng ký trong vòng sáu tháng qua.
Các phản hồi khác đề cập đến điều gì đó bên ngoài hoặc nội bộ, nhưng quan trọng nhất: không nhất thiết phải nhắm mục tiêu đến mô hình của chúng tôi. Chúng tôi hướng tới việc thiết kế một mô hình dự đoán khả năng rời bỏ đối với mỗi người tiêu dùng của chúng tôi. Việc tập hợp mọi dữ liệu bất kể mức độ liên quan của nó sẽ rất mất thời gian
Sau khi thu thập, dữ liệu được thống nhất thông qua bước làm sạch. Luôn biết rằng việc xử lý dữ liệu thô phi cấu trúc là có thể thực hiện được, nhưng cũng phức tạp hơn và tốn thời gian hơn, do đó ít được sử dụng hơn.
Chất lượng tốt của dữ liệu là rất quan trọng, vì nó ảnh hưởng trực tiếp đến chất lượng của mô hình. Trên các dự án như MATRIX, thật không may, đây là nỗ lực tiêu tốn thời gian lớn nhất.
→ Điều này có thể được giảm thiểu về lâu dài bằng cách thiết lập một quy trình thường xuyên để thu thập dữ liệu sạch ngay từ đầu mà chúng tôi dự định thực hiện với việc “Trích xuất”.

Tiếp tục

Bạn đã thu thập, xây dựng, lập mô hình và đào tạo nhiều mô hình phân tích dựa trên dữ liệu để tinh chỉnh nó. Mô hình của bạn hiện đã bắt đầu học hỏi và cải thiện thông qua thực hành. Sau khi đánh giá mô hình của bạn, trao đổi về mô hình và triển khai nó, bây giờ bạn cần biến những hiểu biết sâu sắc thành hành động!
Bạn đã xác định mối quan hệ giữa biến mục tiêu (ngừng sử dụng dịch vụ) và các tính năng chính ảnh hưởng đến thời gian.

TÌNH HUỐNG BỐI CẢNH 04

04

ĐƯA RA QUYẾT ĐỊNH

Juicey

Tiếp tục

< 3 THÁNG

> 3 THÁNG

Độ tuổi

Tương tác với các dịch vụ tiêu dùng?


>35

25-35

<25

Không

1/10

CẢNH BÁO

GIỮ LẠI

2/10

7/10

GIỮ LẠI

SỰ NGUY HIỂM

GIỮ LẠI

2/10

9/10

Đăng ký


Nhờ các phương pháp học máy móc, bạn có được cây quyết định này.
Như bạn có thể thấy, những người tiêu dùng dưới 35 tuổi, những người đã đăng ký ngắn hạn, có điểm ngừng sử dụng dịch vụ thấp nhất.
Nhưng những người tiêu dùng trên 35 tuổi đăng ký ngắn hạn có điểm số rời bỏ cao hơn. Ngoài ra, những người tiêu dùng đã đăng ký dài hạn và tương tác với các dịch vụ tiêu dùng có điểm số ngừng sử dụng dịch vụ thấp hơn. Có nghĩa là họ ít có khả năng hủy đăng ký hơn.

Bây giờ chúng ta hãy xem những hành động bạn có thể thực hiện!




Tình huống 04

Bây giờ, bạn nên làm gì với những kết quả này?

Tiếp tục

NÊN

KHÔNG NÊN

CẮT ƯU ĐÃI CHO NGƯỜI TIÊU DÙNG TRÊN 35 TUỔI.

PHÁT TRIỂN ƯU ĐÃI "MỘT LẦN" CHO NGƯỜI TIÊU DÙNG MỤC TIÊU TRÊN 35

TẠO ĐIỀU KIỆN THUẬN LỢI CHO VIỆC TIẾP CẬN CÁC DỊCH VỤ CỦA NGƯỜI TIÊU DÙNG

DỪNG ĐĂNG KÝ DÀI HẠN

Bạn có
đoán chính
xác không?

Kéo & thả các hành động vào các cột bên phải

Tôi đã đúng

Tôi đã sai

Phân loại chính xác là:

NÊN

KHÔNG NÊN

DỪNG ĐĂNG KÝ DÀI HẠN

PHÁT TRIỂN ƯU ĐÃI "MỘT LẦN" CHO NGƯỜI TIÊU DÙNG MỤC TIÊU TRÊN 35

TẠO ĐIỀU KIỆN THUẬN LỢI CHO VIỆC TIẾP CẬN CÁC DỊCH VỤ CỦA NGƯỜI TIÊU DÙNG

CẮT ƯU ĐÃI CHO NGƯỜI TIÊU DÙNG TRÊN 35 TUỔI.

RẤT TỐT!

Tình huống 04

Tiếp tục

1 - Người tiêu dùng không có tương tác với các dịch vụ của người tiêu dùng
2 - Người tiêu dùng trên 35 tuổi đăng ký ngắn hạn

Cây quyết định cho thấy hai kết quả quan trọng chính:

Bạn ưu tiên kết luận rằng:

Bạn nên tạo điều kiện thuận lợi cho việc tiếp cận dịch vụ của người tiêu dùng vì có vẻ như người tiêu dùng của bạn có nhiều khả năng duy trì đăng ký hơn khi họ tham gia vào dịch vụ đó.

Bạn không nên cắt giảm đề nghị cho người tiêu dùng cao cấp mà hãy suy nghĩ lại về nó. Có thể người tiêu dùng cao tuổi hủy đăng ký vì trước tiên họ có xu hướng nhầm lẫn giữa đăng ký ngắn hạn với ưu đãi một lần, vì họ có thể ít sử dụng các định dạng "hộp" hơn.
Để khắc phục điều này, phát triển ưu đãi "một lần" có thể là một giải pháp để nhắm mục tiêu đến nhóm đối tượng này.

Ồ, hãy nhìn theo một góc độ khác nhé!

Tiếp tục

Hết