Bạn có bao giờ tự hỏi làm thế nào Google hiểu những gì bạn đang tìm kiếm?, những gì mà bạn làm đối với google maps của bạn, Có rất nhiều điều đi vào việc cung cấp kết quả tìm kiếm hữu ích, cũng như lọc các spam, điều mà AI (Trí tuệ nhân tạo) cần là hiểu ngôn ngữ là một trong những kỹ năng quan trọng nhất. Nhờ những tiến bộ trong AI và tự học, hệ thống Tìm kiếm của Google đang hiểu ngôn ngữ của con người tốt hơn bao giờ hết. Và tôi muốn chia sẻ một cái nhìn hậu trường về điều này và đặc biệt là review spam mà đạng có ý định review trên một maps nào đó.
Nhưng trước tiên, chúng ta hãy nhớ lại: Trong những ngày đầu của google maps, trước khi chúng ta có AI tiên tiến, hệ thống của chúng ta chỉ đơn giản gõ cái gì sẽ hiển thị cái đó. Ví dụ: nếu bạn gõ “pziza” vào mục đánh giá cho doanh nghiệp. Google sẽ hiển thị y nguyên chữ “pziza” mà Google không thể kiểm duyệt được thiết bị đó đã nhập ở maps khác, hay người dùng đó đã gõ chữ đó rồi, Và cuối cùng, Google đã học được cách mã hóa các thuật toán để xây dựng lên các lớp mẫu, như lỗi chính tả phổ biến hoặc lỗi chính tả tiềm năng từ các phím lân cận. Bây giờ, với hệ thống trí tuệ nhân tạo tiên tiến, hệ thống của Google có thể nhận ra trực quan hơn nếu một người dùng không tuân thủ những nguyên tắc của google sẽ bị lọc.
Những cải tiến AI cho hệ thống lọc spam của google có nghĩa là Google liên tục hiểu rõ hơn về những gì bạn định làm với maps. Với mọi người luôn phát triển, điều thực sự quan trọng là công cụ trống spam cũng vậy. Trên thực tế, rất nhiều nội dung review mà google thu thập được mỗi ngày là hoàn toàn mới. AI đóng một vai trò quan trọng trong việc đưa hay lọc những review tuân thủ nguyên tắc của google, ngay cả chúng ta cũng không thể nghĩ ra được những gì mà AI làm được, nó vươt ngoài cùng của trí tưởng tượng của bạn.
Chúng ta hãy tìm hiểu kỹ Google xây dưng hệ thống tìm kiếm như thế nào, hệ thống trống spam chỉ là một phần nhỏ trong hệ thống tìm kiếm mà google đang triển khai, chính vì vậy nếu các bạn đang có ý định dùng dịch vụ review google maps giá rẻ thì hãy suy nghĩ lại vì hệ thống tìm kiếm nó còn đưa ra chính xác những gì mà con người muốn huống hồ là trống spam review trong google maps, chính vì điều đó các bạn nên suy nghĩ lại mà nên làm tăng review google maps bằng người thật, sẽ đảm bảo an toàn cho maps của bạn hơn. Giờ là lúc chúng ta hãy tiềm hiệu kỹ hơn về google xây dựng hệ thông tìm kiếm thê nào.
Hệ thống AI kế hợp với các hệ thống khác như thế nào.
Google đã phát triển hàng trăm thuật toán trong những năm qua, như hệ thống chính tả ban đầu của chúng tôi, để giúp cung cấp chính xác những mối liên quan. Khi chúng ta phát triển các hệ thống AI mới, các thuật toán và hệ thống cũ của chúng ta không chỉ bị gác lại. Trên thực tế, Việc lọc spam chạy trên hàng trăm thuật toán và trí tuệ nhân tạo và Google có thể cải thiện nó khi hệ thống của Google – mới và cũ – có thể kết hợp với nhau. Mỗi thuật toán và mô hình có một vai trò chuyên biệt, và chúng kích hoạt vào những thời điểm khác nhau và trong các kết hợp riêng biệt để giúp mang lại kết quả hữu ích nhất. Và một số hệ thống tiên tiến hơn của Google đóng một vai trò nổi bật hơn những hệ thống khác. Chúng ta hãy xem xét kỹ hơn các hệ thống AI lớn đang chạy lọc spam review ngày nay và những gì chúng làm.
RankBrain — một hệ thống xếp hạng thông minh hơn
Khi Google ra mắt RankBrain vào năm 2015, đây là hệ thống học đầu tiên được triển khai trong Tìm kiếm. Vào thời điểm đó, nó mang tính đột phá – không chỉ vì đó là hệ thống AI đầu tiên của google, mà còn vì nó giúp chúng tôi hiểu cách các từ liên quan đến các khái niệm. Con người hiểu điều này theo bản năng, nhưng đó là một thách thức phức tạp đối với máy tính. RankBrain giúp chúng ta tìm thấy thông tin mà trước đây chúng ta không thể hiểu rộng hơn về cách các từ trong tìm kiếm liên quan đến các khái niệm trong thế giới thực. Ví dụ: nếu bạn tìm kiếm “tiêu đề của người tiêu dùng ở cấp độ cao nhất của chuỗi thức ăn”, hệ thống của chúng tôi học hỏi từ việc nhìn thấy những từ đó trên các trang khác nhau mà khái niệm về chuỗi thức ăn có thể liên quan đến động vật, chứ không phải người tiêu dùng của con người. Bằng cách hiểu và kết hợp những từ này với các khái niệm liên quan của chúng, RankBrain hiểu rằng bạn đang tìm kiếm những gì thường được gọi là “kẻ săn mồi đỉnh cao”
Nhờ loại hiểu biết này, RankBrain (như tên của nó cho thấy) được sử dụng để giúp xếp hạng – hoặc quyết định thứ tự tốt nhất cho – kết quả tìm kiếm hàng đầu. Mặc dù đây là mô hình học sâu đầu tiên của Google, RankBrain vẫn tiếp tục là một trong những hệ thống AI lớn cung cấp kết quả cho Tìm kiếm ngày nay.
Mạng lưới AI — một công cụ truy xuất tinh vi
Mạng lưới AI củng cố nhiều hệ thống AI hiện đại ngày nay. Nhưng mãi đến năm 2018, khi Google giới thiệu kết hợp nhiều AI với Tìm kiếm, Google mới có thể sử dụng chúng để hiểu rõ hơn về cách truy vấn liên quan đến các trang. Kết hợp thần kinh giúp chúng ta hiểu các biểu diễn mờ hơn của các khái niệm trong các truy vấn và trang và kết hợp chúng với nhau. Nó xem xét toàn bộ truy vấn hoặc trang thay vì chỉ từ khóa, phát triển sự hiểu biết tốt hơn về các khái niệm cơ bản được thể hiện trong đó. Lấy ví dụ về tìm kiếm “thông tin chi tiết về cách quản lý màu xanh lá cây”. Nếu một người bạn hỏi bạn điều này, có lẽ bạn sẽ bị bối rối. Nhưng với sự kết hợp hệ thống AI, chúng ta có thể hiểu được nó. Bằng cách nhìn vào các đại diện rộng hơn của các khái niệm trong truy vấn – quản lý, lãnh đạo, tính cách và nhiều hơn nữa – kết hợp hệ thống AI có thể giải mã rằng người tìm kiếm này đang tìm kiếm các mẹo quản lý dựa trên hướng dẫn tính cách dựa trên màu sắc phổ biến.
Khi hệ thống của chúng tôi hiểu các khái niệm rộng hơn được thể hiện trong một truy vấn hoặc trang, chúng có thể dễ dàng kết hợp chúng với nhau hơn. Mức độ hiểu biết này giúp google tạo ra một mạng lưới rộng khi chúng tôi quét chỉ mục của mình để tìm nội dung có thể liên quan đến truy vấn của bạn. Đây là những gì làm cho việc kết hợp Hệ thống AI trở thành một phần quan trọng trong cách chúng ta truy xuất các tài liệu liên quan từ một luồng thông tin lớn và liên tục thay đổi.
BERT — một mô hình để hiểu ý nghĩa và bối cảnh
Ra mắt vào năm 2019, BERT là một bước thay đổi lớn trong sự hiểu biết ngôn ngữ tự nhiên, giúp chúng ta hiểu cách kết hợp các từ thể hiện ý nghĩa và ý định khác nhau. Thay vì chỉ đơn giản là tìm kiếm nội dung phù hợp với các từ riêng lẻ, BERT hiểu cách kết hợp các từ thể hiện một ý tưởng phức tạp. BERT hiểu các từ trong một chuỗi và cách chúng liên quan đến nhau, vì vậy nó đảm bảo Google không bỏ các từ quan trọng khỏi truy vấn của bạn – cho dù chúng nhỏ như thế nào. Ví dụ, nếu bạn tìm kiếm “bạn có thể lấy thuốc cho ai đó ở hiệu thuốc”, BERT hiểu rằng bạn đang cố gắng tìm hiểu xem bạn có thể nhận thuốc cho người khác hay không. Trước BERT, chúng tôi đã coi giới từ ngắn đó là điều hiển nhiên, chủ yếu là chia sẻ kết quả về cách điền vào đơn thuốc. Nhờ BERT, chúng tôi hiểu rằng ngay cả những từ nhỏ cũng có thể có ý nghĩa lớn.
Ngày nay, BERT đóng một vai trò quan trọng trong hầu hết mọi truy vấn tiếng Anh. Điều này là do các hệ thống BERT của Google vượt trội ở hai trong số các nhiệm vụ quan trọng nhất trong việc cung cấp kết quả có liên quan – xếp hạng và truy xuất. Dựa trên sự hiểu biết ngôn ngữ phức tạp của nó, BERT có thể rất nhanh chóng xếp hạng các tài liệu cho sự liên quan. Google cũng đã cải thiện các hệ thống kế thừa với đào tạo BERT, làm cho chúng hữu ích hơn trong việc truy xuất các tài liệu có liên quan để xếp hạng. Và trong khi BERT đóng một vai trò quan trọng trong Tìm kiếm, nó không bao giờ hoạt động một mình – giống như tất cả các hệ thống của google, BERT là một phần của một nhóm các hệ thống làm việc cùng nhau để chia sẻ kết quả chất lượng cao.
MUM — chuyển từ ngôn ngữ sang hiểu thông tin
Vào tháng 5, chúng tôi đã giới thiệu cột mốc AI mới nhất của chúng tôi trong Tìm kiếm – Mô hình thống nhất đa nhiệm hoặc MUM. Mạnh hơn bert một ngàn lần, MUM có khả năng cả hiểu và tạo ra ngôn ngữ. Nó được đào tạo trên 75 ngôn ngữ và nhiều nhiệm vụ khác nhau cùng một lúc, cho phép nó phát triển sự hiểu biết toàn diện hơn về thông tin và kiến thức thế giới. MUM cũng đa phương thức, có nghĩa là nó có thể hiểu thông tin trên nhiều phương thức như văn bản, hình ảnh và nhiều hơn nữa trong tương lai.
Mặc dù Google vẫn đang trong những ngày đầu khai thác tiềm năng của MUM, chúng tôi đã sử dụng nó để cải thiện tìm kiếm thông tin vắc-xin COVID-19 và chúng tôi sẽ cung cấp các cách trực quan hơn để tìm kiếm bằng cách sử dụng kết hợp cả văn bản và hình ảnh trong Google Lens trong những tháng tới. Đây là những ứng dụng rất chuyên biệt – vì vậy MUM hiện không được sử dụng để giúp xếp hạng và cải thiện chất lượng kết quả tìm kiếm như RankBrain, kết hợp hệ thống AI và hệ thống BERT.
Khi chúng tôi giới thiệu nhiều trải nghiệm được hỗ trợ bởi MUM cho Tìm kiếm, chúng tôi sẽ bắt đầu chuyển từ hiểu ngôn ngữ nâng cao sang hiểu biết nhiều sắc thái hơn về thông tin về thế giới. Và như với tất cả các cải tiến cho Tìm kiếm, bất kỳ ứng dụng MUM nào cũng sẽ trải qua một quá trình đánh giá nghiêm ngặt, đặc biệt chú ý đến ứng dụng có trách nhiệm của AI. Và khi chúng được triển khai, chúng sẽ tham gia điệp khúc của các hệ thống chạy cùng nhau để làm cho Tìm kiếm hữu ích.
Tham khảo tài liệu từ google