Demo interaktif ini memungkinkan Anda menjelajahi Vector Search 2.0, database vektor yang dikelola sepenuhnya untuk Google Cloud. Gunakan demo ini untuk menelusuri jutaan listingan produk dengan penelusuran semantik (didukung dengan embedding otomatis Gemini penelusuran teks kata kunci atau penelusuran campuran yang menggunakan Reciprocal Rank Fusion (RRF) untuk menggabungkan penelusuran semantik dan penelusuran teks kata kunci. Hasil dapat diberi peringkat ulang menggunakan Gemini Enterprise Agent Platform Ranking API untuk pemberian peringkat ulang.
Manfaat Vector Search 2.0
Vector Search memerlukan pembuatan embedding, deployment indeks, dan Vertex AI Feature Store terpisah untuk metadata. Vector Search 2.0 menyediakan penyimpanan terpadu untuk data dan embedding, pembuatan embedding otomatis, dan penelusuran teks bawaan tanpa mengharuskan Anda mengelola infrastruktur.
Cobalah!
Untuk menjalankan:
Di kolom Query, deskripsikan item yang ingin Anda kueri (misalnya,
vintage 1970s pinball machine). Atau, klik Generate Query untuk membuat deskripsi secara otomatis.Klik Submit atau tekan Enter.
Bereksperimenlah dengan berbagai opsi dalam demo untuk memahami Vector Search 2.0 dan dasar-dasar teknologi penelusuran vektor. Untuk mengetahui informasi selengkapnya, buka Antarmuka Pengguna.
Antarmuka pengguna
Bagian ini menjelaskan setelan di UI yang dapat Anda gunakan untuk mengontrol hasil yang ditampilkan Vector Search 2.0 dan cara hasil tersebut diberi peringkat.
Set data
Gunakan menu drop-down Dataset untuk memilih set data yang akan digunakan Vector Search 2.0 untuk menjalankan kueri Anda. Untuk mengetahui informasi tentang setiap set data, buka Set Data.
Kueri
Untuk menjalankan kueri:
Klik Dataset dan pilih set data yang akan digunakan untuk menjalankan kueri Anda.
Di kolom Query, tambahkan deskripsi, ajukan pertanyaan, atau masukkan satu atau beberapa kata kunci untuk menentukan item yang akan ditampilkan Vector Search 2.0. Atau, klik Generate Query untuk membuat kueri secara otomatis.
Lakukan salah satu hal berikut:
- Untuk menampilkan hasil yang semantik, pilih Semantic.
- Untuk menampilkan hasil berdasarkan sintaksis teks kueri, pilih Text.
- Untuk melakukan penelusuran campuran, pilih Semantic dan Text.
Jika Anda membuat kueri semantik untuk set data Mercari 3M items (128-dim Gemini text embeddings) atau Mercari 3M items (768-dim Gemini text embeddings) , klik Query Task Type , lalu pilih QUESTION_ANSWERING atau RETRIEVAL_QUERY.
Klik Submit atau tekan Enter untuk menjalankan kueri.
Mengubah
Ada banyak opsi yang dapat Anda gunakan untuk mengubah hasil yang ditampilkan Vector Search 2.0 dari kueri.
Klik Rows dan pilih jumlah maksimum hasil penelusuran yang ingin ditampilkan Vector Search 2.0.
Pilih Semantic untuk menampilkan hasil yang semantik.
Pilih Text untuk menampilkan hasil berdasarkan sintaksis teks kueri Anda.
Pilih Semantic dan Text untuk mengaktifkan penelusuran campuran.
Pilih Rerank untuk memberi peringkat ulang hasil penelusuran berdasarkan relevansi kuerinya. Untuk mengetahui informasi selengkapnya, lihat Meningkatkan kualitas penelusuran dan RAG dengan ranking API.
Pilih Use kNN untuk menggunakan algoritma k-nearest neighbors guna mengambil hasil penelusuran. Karena kNN memberikan tingkat recall 100%, algoritma ini sangat berguna saat melakukan proses debug atau pengujian.
Klik Query Task Type dan pilih jenis tugas kueri yang akan digunakan. Opsi ini hanya tersedia saat menggunakan set data Mercari 3M items (128-dim Gemini text embeddings) dan Mercari 3M items (768-dim Gemini text embeddings). Untuk mengetahui informasi selengkapnya tentang jenis tugas kueri, buka Memilih jenis tugas embedding.
Di kolom RRF Alpha , masukkan nilai antara 0,0 dan 1,0 untuk menentukan efek peringkat RRF. Opsi ini hanya tersedia untuk penelusuran campuran (baik Semantic maupun Text dipilih).
Nilai alfa:1.0- Hasil peringkat murni berdasarkan kemiripan semantik (padat).0.0- Hasil peringkat murni berdasarkan relevansi kata kunci (renggang).0.5- Hasil peringkat dengan bobot yang sama diberikan untuk kemiripan semantik (padat) dan relevansi kata kunci (renggang).
Untuk mengetahui informasi selengkapnya, lihat Apa yang dimaksud dengan Reciprocal Rank Fusion?
Metrik
Setelah kueri dijalankan, Anda akan mendapatkan metrik latensi yang menguraikan waktu yang diperlukan untuk menyelesaikan berbagai tahap penelusuran.
Hal ini mencakup:
- Total latensi dari semua sumber.
- Jumlah waktu yang diperlukan untuk membuat embedding dan melakukan penelusuran vektor.
- Jumlah waktu yang diperlukan untuk memberi peringkat ulang jika Rerank dipilih.
- Total latensi dari jaringan dan sumber lainnya.
Embedding
Vector Search 2.0 mendukung jenis embedding berikut:
Multimodal: Penelusuran semantik multimodal pada gambar item. Untuk mengetahui detailnya, buka Apa yang dimaksud dengan Penelusuran Multimodal: "LLM dengan visi" mengubah bisnis.
Teks (kemiripan semantik): Penelusuran semantik teks pada nama dan deskripsi item berdasarkan kemiripan semantik. Untuk mempelajari lebih lanjut, buka Vertex AI Embeddings untuk Teks: Cara mudah Grounding LLM.
Teks (dokumen pengambilan): Penelusuran asimetris berdasarkan pertanyaan atau frasa singkat. Untuk mempelajari lebih lanjut, buka Vertex AI Embeddings untuk Teks: Cara mudah Grounding LLM.
Kata: Pemahaman semantik tingkat kata dengan inferensi yang sangat cepat dan sangat ringkas.
Proses kueri
Di Vector Search 2.0, proses kueri bergantung pada jenis penelusuran yang dilakukan dan model embedding.
Penelusuran semantik dan campuran
Pembuatan embedding dan penelusuran terjadi dalam satu panggilan API.
Vector Search 2.0 otomatis membuat embedding kueri di sisi server menggunakan
model yang ditentukan dalam vertex_embedding_config untuk
Koleksi,
melakukan penelusuran, dan menampilkan hasil dengan metadata lengkap tanpa memerlukan
pengambilan Vertex AI Feature Store terpisah.
Word2Vec dan multimodal
Klien membuat embedding kueri dan mengirimkannya ke Vector Search 2.0 untuk penelusuran vektor. Hasilnya masih menyertakan metadata lengkap dari Koleksi dan pengambilan Vertex AI Feature Store tidak diperlukan.
Teks
Vector Search 2.0 melakukan pencocokan kata kunci bawaan secara langsung. Embedding tidak dibuat.
Set data
| Set Data | Deskripsi | Model Embedding | Jenis Tugas Embedding |
|---|---|---|---|
| Item Mercari 1 juta (embedding teks Gemini 768 dimensi) |
Menggunakan model embedding Gemini Embedding 2 dengan embedding teks dan gambar terpisah. Set data ini mendukung penelusuran teks ke teks dan teks ke gambar menggunakan kolom vektor yang berbeda. | gemini-embedding-2-preview
|
SEMANTIC_SIMILARITY |
| Item Mercari 3 juta (embedding teks Gemini 128 dimensi) |
Memiliki jumlah dimensi embedding yang lebih sedikit sehingga memberikan ukuran indeks dan biaya penyimpanan yang lebih kecil. Set data ini mungkin memiliki akurasi yang lebih rendah daripada item Mercari 3 juta (embedding teks Gemini 768 dimensi). | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| Item Mercari 3 juta (embedding teks Gemini 768 dimensi) |
Memiliki embedding dimensi penuh dengan embedding otomatis dan akurasi semantik teks yang tinggi. Set data ini menggunakan RETRIEVAL_DOCUMENT untuk pencocokan dokumen kueri asimetris. | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| Item Mercari 3 juta (embedding teks Gemini 768 dimensi, kemiripan semantik) |
Menggunakan jenis tugas SEMANTIC_SIMILARITY untuk pencocokan kemiripan. Set data ini paling cocok untuk kasus penggunaan yang memerlukan fungsi "temukan item serupa" dengan kueri dan dokumen yang memiliki semantik yang sama. | gemini-embedding-001
|
SEMANTIC_SIMILARITY |
| Item Mercari 3 juta (embedding multimodal Vertex AI 1408 dimensi) |
Memiliki embedding multimodal Vertex AI yang mengenkode gambar item untuk penelusuran gambar. | multimodal-embedding-001
|
T/A |
| Item Mercari 3 juta (embedding teks Word2Vec 100 dimensi) |
Menggunakan model embedding Gensim Word2Vec. Set data ini memiliki inferensi tercepat. Set data ini hanya memberikan pemahaman semantik tingkat kata, tetapi sangat ringkas. | Gensim Word2Vec | T/A |