- vừa được xem lúc

Câu chuyện chuyển giao từ CloudSearch sang Elasticsearch

0 0 7

Người đăng: Mạnh Nguyễn

Theo Viblo Asia

Ở bài viết này, chúng tôi xin chia sẻ với các bạn một câu chuyện về 2 hệ thống này ở Pixta Việt Nam

Câu chuyện chuyển giao từ CloudSearch sang Elasticsearch

Với Cloudsearch, chúng tôi đã sử dụng dịch vụ này từ rất lâu, khoảng đầu những năm 2010. Với dịch vụ Cloudsearch, chúng tôi sử dụng nó làm một search engine chính cho hệ thống tìm kiếm của mình.

Tuy nhiên, bắt đầu từ năm 2014, AWS đã ngừng hỗ trợ và phát triển cho search engine này. Cùng với đó là DSL của Cloudsearch khó sử dụng, các công cụ hỗ trợ cũng như cộng đồng phát triển ngày càng thu hẹp lại. Vì thế, chúng tôi quyết định sử dụng Elasticsearch thay thế với những lợi thế vượt trội.

Sau khi chuyển giao toàn bộ logic tìm kiếm từ Cloudsearch sang Elasticsearch, với cấu hình hiện tại của hệ thống tìm kiếm, chi phí hàng tháng vào khoảng vài nghìn đô la.

Tính năng đang sử dụng của Elasticsearch đang mang lại giá trị lớn cho công ty Đối với Elasticsearch, chức năng full text search đã quá nổi tiếng và làm nên thương hiệu của dịch vụ này. Chúng tôi đã áp dùng nó vào hệ thống của mình để giảm thời gian truy vấn và tối ưu sự chính xác và phù hợp đối với mỗi lần tìm kiếm của người dùng.

Ngoài ra, Elasticsearch còn cung cấp mã nguồn mở điều đó thật sự đã giúp chúng tôi rất nhiều trong việc tích hợp AI, Machine Learning vào hệ thống nhằm giúp kết của tìm kiếm của người dùng trở nên thân thiện và đúng với mục đích tìm kiếm hơn. Có thể kể đến một số tích hợp như Learning To Rank, PCC, Face-search,…

Còn một điều nữa rất thú vị là chức năng More Like This Query của Elasticsearch giúp chúng tôi tạo ra được những danh sách ảnh, video liên quan đến nhau, việc này giúp cho người dùng không công sức để tìm kiếm những hình ảnh liên quan mà nó được hiển thị ngay dưới ảnh gốc và thay đổi theo ngày, không bị trùng lặp và không tốn công sức chọn ảnh thủ công như những trang web khác. Điều này thật sự tuyệt vời khi nó đã và đang giúp CVR của chúng tôi tăng lên từ 1.5 – 3% mỗi tháng kể từ lúc apply lên hệ thống.

Các ảnh tương tự hiển thị trên trang chi tiết

Các ảnh tương tự hiển thị trên xem nhanh của trang tìm kiếm

Theo thống kê hàng tháng, tỷ lệ click rate vào những items được suggest rất khả quan, nó chiếm khoảng 6.6% trên tổng số lượng click của toàn hệ thống.

Đó là 2 chức năng lớn nhất trong nhiều chức năng khác mà chúng tôi đang sử dụng cũng như update hệ thống của mình hàng ngày. Ngoài ra, công ty chúng tôi hiện có một team AI gần 20 thành viên đang làm thực hiện nhiều dự án AI, ML để tích hợp vào hệ thống search của mình, nhằm đem lại nhiều giá thật trị và tăng cao trải nghiệm sử dụng cho người dùng, cũng như làm tăng doanh thu cho khách hàng.

Đến đây, bạn chắc hẳn sẽ đặt ra một câu hỏi là: Liệu làm việc với hệ thống này có phức tạp không?

Câu trả lời này là của bản thân tôi – người đang trực tiếp đang làm việc với hệ thống: Bạn biết đó, Elasticsearch có một cộng đồng rất phát triển và nhiệt tình, thêm vào đó những service tools mà chúng tôi áp dùng như Kibana, Logstash, Newrelic, Treasure Data,… nhằm mục đích đảm bảo cho hệ thống hoạt động trơn tru, hiệu quả phần nhiều sẽ làm bạn cảm thấy khó khăn và không biết tiếp cận thế nào khi mới bắt đầu. Nhưng sau một vài tháng bạn sẽ dần quen với nó và trở nên dễ dàng hơn nhiều.

Đoạn kết

Việc áp dụng những tiện ích của Elasticsearch vào hệ thống đem lại nhiều giá trị sử dụng nhưng đồng thời, chúng tôi cũng cần rất nhiều sự nỗ lực để vận hành nó một cách trơn tru. Với chúng tôi, sự thử thách sẽ giúp cả team nâng cao tinh thần trách nhiệm và khi thành quả xuất hiện thì đó cũng chính là trái ngọt mà chúng tôi hướng đến.

Nếu bạn cảm thấy hứng thú, tò mò cũng như có tinh thần ham học hỏi, hãy apply vào Pixta Vietnam nhé! Hy vọng chúng ta sẽ được làm việc, giải quyết vấn đề cùng nhau.

Tìm hiểu thêm về Pixta và cơ hội làm việc tại Pixta

🌐 Website |🏠 Facebook | 🔖 LinkedIn |✉️ Email: recruit.vn@pixta.co.jp

Bình luận

Bài viết tương tự

- vừa được xem lúc

PDF Export, cẩn thận với những input có thể truyền vào

Giới thiệu. Dạo gần đây mình tình cờ gặp rất nhiều lỗi XSS, tuy nhiên trang đó lại có sử dụng dữ liệu người dùng input vào để export ra PDF.

0 0 66

- vừa được xem lúc

Giới thiệu về AWS Batch

Khi sử dụng hệ thống cloud service, điều chúng ta thường phải quan tâm đến không chỉ là hiệu suất hoạt động (performance) mà còn phải chú ý đến cả chi phí bỏ ra để duy trì hoạt động của hệ thống. Chắn hẳn là hệ thống lớn hay nhỏ nào cũng đã từng phải dùng đến những instance chuyên để chạy batch thực

0 0 143

- vừa được xem lúc

Tìm hiểu về AWS KMS

1. AWS KMS là gì. Ở KMS bạn có thể lựa chọn tạo symetric key (khóa đối xứng) hoặc asymetric key (khóa bất đối xứng) để làm CMK (Customer Master Key). Sau khi tạo key thì có thể thiết đặt key policy để control quyền access và sử dụng key.

0 0 66

- vừa được xem lúc

AWS VPC cho người mới bắt đầu

Tuần này, tôi trình bày lại những gì tôi đã học được về Virtual Private Cloud (VPC) của Amazon. Nếu bạn muốn xem những gì tôi đã học được về AWS, hãy xem Tổng quan về DynamoDB và Tổng quan về S3. VPC là gì. Những điều cần lưu ý:.

0 0 84

- vừa được xem lúc

AWS Essentials (Phần 6): Guildline SNS Basic trên AWS

Tiếp tục với chuỗi bài viết về Basic AWS Setting, chúng ta tiếp tục tìm hiểu tiếp tới SNS (Simple Notification Service). Đây là một service của AWS cho phép người dùng setting thực hiện gửi email, text message hay push notification tự động tới mobile device dựa trên event người dùng setting phía AWS

0 0 145

- vừa được xem lúc

Sử dụng Amazon CloudFront Content Delivery Network với Private S3 Bucket — Signing URLs

Trong nhiều trường hợp, thì việc sử dụng CDN là bắt buộc. Mình đã trải nghiệm với một số CDN nhưng cuối cùng mình lựa chọn sử dụng AWS CloudFront.

0 0 118