Embedding

Embedding · Tekoäly

Lyhyesti

Tekstin tai koodin muuntaminen numeeriseksi vektoriksi merkityksen vertailua varten.

Embedding on tapa muuntaa teksti tai koodi numeeriseksi vektoriksi niin, että merkitykseltään samankaltaiset asiat ovat lähellä toisiaan vektoriavaruudessa. Tämä mahdollistaa semanttisen haun: "kirjautumislomake" löytää myös "login form" -tuloksia koska niiden merkitys on sama. Vibekoodauksessa embeddingit ovat Cursorin @codebase-haun ja RAG-järjestelmien taustalla. Kun Cursor indeksoi koodikantasi, se luo embeddingin jokaisesta tiedostosta ja funktiosta. Näin se osaa löytää relevantin koodin kun kysyt jotain. Embeddingejä voi luoda OpenAI:n, Cohere:n tai avoimen lähdekoodin mallien avulla.

Esimerkkejä

Cursor indeksoi koodikantasi embeddingeiksi @codebase-hakua varten

Semanttinen haku: "kirjautuminen" löytää myös "login" ja "auth" -tiedostot

RAG-järjestelmä hakee relevantin dokumentaation embeddingien avulla

OpenAI Embeddings API muuntaa tekstin vektoreiksi pilvipalveluna