Text Search trong MongoDB

Bắt đầu từ phiên bản 2.4, MongoDB bắt đầu hỗ trợ các Text Index để tìm kiếm bên trong nội dung chuỗi. Text Search sử dụng kỹ thuật Stemming để tìm kiếm các từ xác định trong các trường chuỗi bằng việc xóa các Stemming Word như a, an, the,… Hiện tại, MongoDB hỗ trợ khoảng 15 ngôn ngữ.

Kích hoạt Text Search trong MongoDB

Lúc đầu, Text Search là một tính năng mang tính thử nghiệm, nhưng bắt đầu từ phiên bản 2.6, cấu hình được kích hoạt theo mặc định. Nhưng nếu bạn đang sử dụng phiên bản trước của MongoDB, bạn cần kích hoạt Text Search với code sau:

>db.adminCommand({setParameter:true,textSearchEnabled:true})

Tạo Text Index trong MongoDB

Bạn theo dõi Document sau dưới posts collection chứa post_text và tags của nó.

{
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": [
      "mongodb",
      "tutorialspoint"
   ]
}

Chúng ta sẽ tạo một Text Index trên trường post_text để mà chúng ta có thể tìm kiếm bên trong phần text của posts:

>db.posts.ensureIndex({post_text:"text"})

Sử dụng Text Index trong MongoDB

Lúc này, bạn đã tạo Text Index trên trường post_text, chúng ta sẽ tìm kiếm tất cả posts mà có từ tutorialspoint trong phần text của chúng:

>db.posts.find({$text:{$search:"tutorialspoint"}})

Lệnh trên trả về các Document có từ tutorialspoint trong post_text:

{ 
 "_id" : ObjectId("53493d14d852429c10000002"), 
 "post_text" : "enjoy the mongodb articles on tutorialspoint", 
 "tags" : [ "mongodb", "tutorialspoint" ]
}
{
 "_id" : ObjectId("53493d1fd852429c10000003"), 
 "post_text" : "writing tutorials on mongodb",
 "tags" : [ "mongodb", "tutorial" ] 
}

Nếu bạn đang sử dụng phiên bản MongoDB cũ, bạn phải sử dụng lệnh sau:

>db.posts.runCommand("text",{search:" tutorialspoint "})

Việc sử dụng Text Search cải thiện đáng kể hiệu quả tìm kiếm khi so sánh với tìm kiếm thông thường.

Xóa Text Index trong MongoDB

Để xóa một Text Index đang tồn tại, đầu tiên tìm tên của chỉ mục bởi sử dụng truy vấn:

>db.posts.getIndexes()

Sau khi lấy tên của chỉ mục từ truy vấn trên, chạy lệnh sau. Ở đây, post_text_text là tên của chỉ mục.

>db.posts.dropIndex("post_text_text")