Case-study: Coca-Cola Nhật Bản đã sử dụng thông tin thu thập từ 700000 máy bán hàng tự động thế nào?

Ảnh 1: Coca-Cola Bottlers Japan vận hành khoảng 700.000 máy bán hàng tự động trên khắp Nhật Bản.

Nhật Bản là quốc gia nổi tiếng với hàng triệu máy bán hàng tự động xuất hiện ở khắp mọi nơi trên đường phố, trong các tòa nhà, quanh các sân vận động. Dường như trên khắp Nhật Bản đều có sự xuất hiện của một chiếc máy bán hàng tự động. Các chủ sở hữu và người vận hành máy bán hàng tự động, bao gồm các hãng nước giải khát, thường lựa chọn sản phẩm để bày bán trong máy bán hàng tự động dựa vào từng khu vực và nhu cầu chính tại các khu vực đó. Ví dụ, các máy đặt tại khu văn phòng chủ yếu bày bán cà phê và nước tăng lực, còn tại các cơ sở thể thao sẽ là đồ uống thể thao và nước khoáng. Sản phẩm cũng thay đổi theo mùa, ví dụ như vào mùa hè thì sẽ có đồ uống lạnh, còn mùa đông thì có đồ uống nóng.

Thông thường, đơn vị vận hành máy bán hàng tự động dựa vào trực giác và kinh nghiệm để lựa chọn sản phẩm cho máy bán hàng tự động. Tuy nhiên, trong những năm gần đây, các nhà sản xuất như Coca-Cola Bottlers Japan (CCBJ) đã chuyển sang sử dụng dữ liệu để phân tích và đưa ra quyết định chiến lược về thời gian và vị trí đặt sản phẩm trong máy.

CCBJ là hãng sản xuất nước đóng chai Coca-Cola số một ở châu Á và máy bán hàng tự động chiếm phần lớn hoạt động kinh doanh của công ty. Tổ chức này vận hành khoảng 700.000 máy bán hàng trên khắp Tokyo, Osaka, Kyoto và 35 quận. Minori Matsuda, Chuyên gia phát triển của Google và cũng là Giám đốc Khoa học Dữ liệu tại CCBJ, cho biết “Hàng tỷ bản ghi dữ liệu được thu thập từ 700.000 thiết bị vật lý là một tài sản lớn và là một kho tàng để chúng tôi tận dụng”.

Ông Minori cho biết, tại các máy bán hàng tự động ở những cơ sở thể thao, thông thường đồ uống thể thao sẽ bán chạy nhất. Tuy nhiên, khi phân tích dữ liệu mua hàng, các nhà bán nhận thấy rằng, nhiều phụ huynh trong lúc đợi con hoặc khi đến xem các buổi thi đấu thường xuyên mua đồ uống ngọt, ví dụ như trà sữa. Ông nói: “Phân tích dữ liệu mang lại cho chúng tôi những khám phá mới và bằng cách sử dụng các kỹ thuật kể chuyện hấp dẫn từ phân tích dữ liệu, chúng tôi đang dần thấm nhuần văn hóa dữ liệu cho công ty mình. Quyết định nên được tạo ra bằng cách xem xét sự thật hơn là từ giả định!”

Minori tin rằng, để phân tích khối lượng dữ liệu khổng lồ thu thập từ hơn 700.000 máy bán hàng tự động, doanh nghiệp cần một nền tảng phân tích mạnh mẽ. Tuy nhiên mãi đến gần đây, CCBJ vẫn phải trích xuất dữ liệu từ các hệ thống lõi, rồi tải các dữ liệu này lên kho dữ liệu rồi mới tiến hành phân tích. Khi hàng tỷ bản ghi dữ liệu, bao gồm cả các dữ liệu giao dịch, sẽ đặt ra một số thách thức đối với các nền tảng phân tích truyền thống. Những nền tảng này không thể xử lý dữ liệu hiệu quả ở quy mô lớn, và thường mất một ngày mới trả kết quả về, hơn nữa lại tốn chi phí bảo trì.

CCBJ quyết định sử dụng Google Cloud để xây dựng nền tảng máy học (Machine Learning – ML) để hỗ trợ cho các hệ thống hiện có vào tháng 8/2020. “Tôi cho rằng Google Cloud có lợi thế ở tất cả các sản phẩm và được thiết kế tốt”, ông Minori phát biểu, đồng thời nhấn mạnh khả năng mở rộng và chi phí của nền tảng Google Cloud cho phép doanh nghiệp thực hiện phương pháp ‘thử và sai’ để đạt được kết quả tốt nhất từ ​​ML. Google Cloud cũng cung cấp tính năng hiển thị theo yêu cầu và tính linh hoạt để giúp doanh nghiệp thay đổi hàng ngày theo các chỉ số hiệu suất chính.

Nền tảng MLOps hợp lý hóa việc phát triển đường ống dữ liệu ML

CCBJ đã sử dụng Vertex AI (trước đây là AI Platform) để xây dựng nền tảng phân tích, tập trung vào kho dữ liệu phân tích BigQuery và sử dụng một phần AutoML cho dữ liệu dạng bảng (tabular data). Minori cho biết: “Chúng tôi đã tạo ra một mô hình dự đoán để lựa chọn vị trí đặt máy bán hàng tự động, những sản phẩm nào nên được xếp trong máy và ở mức giá nào, các sản phẩm đó sẽ bán được bao nhiêu và triển khai một cơ chế có thể phân tích trên bản đồ. Ông Minori cũng nói thêm rằng, việc xây dựng nền tảng với Google Cloud không khó. “Chúng tôi có thể hiện thực hóa điều đó trong một khoảng thời gian ngắn với tốc độ nhanh chóng, từ kiểm tra nền tảng đến giới thiệu, đào tạo mô hình dự đoán, dùng thử, triển khai.”

Ảnh 2: Nền tảng phân tích dữ liệu với Vertex AI của CCBJ

Nền tảng phân tích dữ liệu của CCBJ bao gồm:

Nguồn dữ liệu: Dữ liệu thu thập từ các máy bán hàng tự động đều được lưu trữ trên BigQuery.

Dữ liệu thăm dò và Feature Engineering: Minori và các nhà khoa học dữ liệu tại CCBJ đang sử dụng Vertex Notebooks để truy cập dữ liệu trên BigQuery bằng cách thực hiện các truy vấn SQL trực tiếp từ Notebooks. Môi trường này được sử dụng cho quá trình khám phá dữ liệu và Feature Engineering.

Đào tạo ML: CCBJ sử dụng AutoML cho dữ liệu dạng bảng, đào tạo mô hình tùy chỉnh trên Vertex AI và BigQuery ML. AutoML cung cấp hiệu suất mô hình với các phương pháp đo lường hiệu suất AUC và tạo biểu đồ về mức độ quan trọng.

Dự đoán và phục vụ ML:

  • CCBJ sử dụng Dự đoán Trực tuyến cho các mô hình AutoML và Dự đoán Trực tuyến cho các mô hình tùy chỉnh của dự đoán thời gian thực.

  • Dự đoán hàng loạt (Batch Prediction) được sử dụng để tạo một bản đồ dự đoán lớn quy mô quốc gia.

  • Kết quả dự đoán được phân phối đến máy tính bảng của sales manager.

CCBJ bắt đầu xây dựng nền tảng vào tháng 9/2020 và hoàn thành trong vòng một tháng. Doanh nghiệp này đã tiến hành thử nghiệm tại Kyoto kể từ tháng 2/2021, và triển khai nền tảng này cho các sales manager ở 35 quận thuộc một khu đô thị từ tháng 4. Minori nói: “Phân tích dữ liệu được tích hợp vào thói quen hàng ngày của các sales manager với 100% hiệu suất sử dụng”. “Các sales manager có thể sử dụng kết quả dự đoán trên máy tính bảng và đạt được độ chính xác khá cao ngay từ đầu”.

Phần khó nhất là việc đào tạo các sales manager, để họ hiểu lý do đằng sau kết quả dự đoán của ML cho từng kết quả cụ thể, như vậy họ mới có thể bị thuyết phục để sử dụng kết quả đó. “Ví dụ như mô hình dự đoán đưa ra một một vị trí lắp đặt mới, nhưng có vẻ như không có thông tin nào cho thấy việc lắp đặt máy bán hàng ở đó là hợp lý. Vì vậy tôi đã trực tiếp đến địa điểm đó. Hóa ra gần đó có một cửa hàng xe máy và là nơi tụ tập của những người trẻ tuổi thích xe máy”, ông Minori chia sẻ. “Hoặc khu vực đó là nơi người già trong khu phố thường đến giao lưu”.

“Trong nhiều trường hợp, các khám phá mới không thể hiểu được nếu chỉ xem thông tin lấy từ dữ liệu.”

Minori cũng chỉ ra một hiện tượng trong đó con người theo đuổi và xác nhận các yếu tố được suy ra từ mô hình dự đoán – nghĩa là một khi họ đã phân tích và nhận thấy kết quả dự đoán có hiệu quả, họ sẽ tự hỏi tại sao không thể thực hiện cùng một loại phân tích hoặc dự đoán vào lần sau. Chu kỳ tạo ra nhiều câu hỏi hơn, nhiều thông tin được thu thập hơn và nhiều dữ liệu được thu thập hơn để phân tích có nghĩa là độ chính xác của kết quả được cải thiện.

Ảnh 3: Sales manager sử dụng máy tính bảng để truy cập kết quả dự đoán theo thời gian thực

Minori mô tả Vertex AI có một số điểm mạnh trong việc giúp CCBJ xây dựng nền tảng phân tích dữ liệu ML. Ông nói: “Một trong những công lao chính của Vertex AI là giúp chúng tôi nhận ra MLOps giúp hợp lý hóa toàn bộ vòng đời phát triển từ xây dựng đường ống ML đến thực thi.

Với việc phân tích dữ liệu gần thời gian thực thông qua Google Cloud, đội ngũ tại CCBJ có thể dành thời gian phát triển chiến lược thay vì chờ dữ liệu trả về từ phòng IT. Việc phân tích dữ liệu thăm dò cũng dễ dàng hơn vì đã liên tục thử và sai trước đó, giúp cải thiện đáng kể độ chính xác của kết quả phân tích. Trước khi sử dụng Học máy, hầu hết các quy trình lựa chọn nơi đặt máy bán hàng của CCBJ đều được quyết định bởi các giác quan của con người, bằng cách xem bản đồ để tìm các điểm gợi ý. Bằng cách sử dụng Học máy để tạo ra một số lượng lớn các đề xuất về điểm vị trí, hiệu quả của việc định tuyến nhân viên bán hàng đã được cải thiện đáng kể.

Trong tương lai, CCBJ đặt mục tiêu tự động hóa quy trình đào tạo liên tục đường ống dữ liệu với Vertex AI. Minori nói: “CCBJ là một công ty công nghệ hoạt động trong ngành công nghiệp thực phẩm. Với việc vận hành mạng lưới máy bán hàng tự động gồm 700.000 máy, tổ chức này muốn tạo ra các doanh nghiệp mới dựa trên việc sử dụng và phân tích dữ liệu. Một số doanh nghiệp có thể dựa trên các sáng kiến ​​của Mục tiêu Phát triển Bền vững (SDGs) như sử dụng chai PET tái chế, các biện pháp ngăn ngừa thất thoát thực phẩm và cách sử dụng máy bán hàng tự động để đóng góp cho cộng đồng địa phương, mà chúng tôi đã thực hiện trong một thời gian. Sẽ rất thú vị nếu chúng tôi có thể cộng tác với Google Cloud để đạt được những mục tiêu này trong tương lai.”