Kioxia Verbetert Zijn Vectorzoekmachine AiSAQ voor Generatieve AI-Systemen met RAG

Kioxia Lanceert Nieuwe Versie van AiSAQ: Optimalisatie van Prestaties zonder DRAM

Kioxia Corporation, een wereldleider in geheugensystemen, heeft een belangrijke update aangekondigd voor haar open-source software AiSAQ (All-in-Storage ANNS with Product Quantization). Dit softwarepakket is ontworpen om de prestaties van vectorzoekopdrachten in systemen voor augmented recovery generation (RAG) te verbeteren, en dat zonder de afhankelijkheid van DRAM-geheugen.

Nieuwe Functies van AiSAQ

De nieuwste versie van AiSAQ introduceert configureerbare controles waarmee systeemarchitecten het optimale evenwicht kunnen bepalen tussen het aantal op te slaan vectoren en de zoekprestaties (queries per seconde). Dit stelt hen in staat om het systeem aan te passen aan de specifieke vereisten van elke werklast, zonder dat er hardwarewijzigingen nodig zijn.

Een SSD-eerst Benadering voor Vectorzoekopdrachten

AiSAQ, dat oorspronkelijk in januari 2025 werd gepresenteerd, maakt gebruik van een geoptimaliseerd algoritme voor het zoeken naar nabije buren (ANNS) dat specifiek is ontwikkeld voor SSD’s, voortbouwend op de technologie DiskANN van Microsoft. In tegenstelling tot traditionele systemen die grote vectorindexen in DRAM laden, stelt AiSAQ gebruikers in staat om zoekopdrachten rechtstreeks vanaf de opslag uit te voeren, waardoor efficiëntie in schaling wordt vergroot en de beperkingen van hostgeheugen worden omzeild.

Kioxia legt uit: “Wanneer de capaciteit van de SSD vaststaat, betekent een verbetering van de zoekprestaties dat er minder vectoren kunnen worden opgeslagen. Meer vectoren opslaan vermindert de prestaties.” Deze nieuwe versie maakt het voor beheerders mogelijk om het systeem precies af te stemmen, waardoor ze het meest geschikte evenwicht kunnen vinden tussen prestaties en gegevensvolume, wat cruciaal is voor toepassingen zoals RAG, offline semantische zoekopdrachten en aanbevelingssystemen.

Innovaties van AiSAQ-DiskANN

Enkele belangrijke vernieuwingen in de software zijn:

  • Schaalbare zoekopdrachten zonder DRAM: De vectoren PQ (Product Quantization) worden op aanvraag van de schijf gelezen.
  • Online PQ-vectoren: Deze kunnen worden opgeslagen als onderdeel van de indexknoop om invoer-/uitvoeroperaties te verminderen.
  • Geoptimaliseerde reorganisatie van vectoren: Minimaliseert schijftoegang tijdens zoekopdrachten.
  • Meerdere toegangspunten: Creëert verschillende toegangsmogelijkheden tot de index om iteraties te verminderen.
  • Vectorstraal breedte: Stelt gebruikers in staat om zoekoperaties te paraleliseren door het aantal knopen per iteratie aan te passen.
  • Statische en dynamische PQ-vectorcache: Versnelt de toegang door gebruik te maken van LRU-beleidsregels per thread.

Dankzij deze verbeteringen positioneert AiSAQ zich als een robuuste en schaalbare oplossing voor intensieve vectorzoekopdrachten, vooral in omgevingen met generatieve kunstmatige intelligentie, waar opslag-efficiëntie en latentie van cruciaal belang zijn.

AiSAQ in de Open Source Gemeenschap

Kioxia heeft de software openlijk op GitHub gepost (aisaq-diskann), waardoor het gemakkelijk is voor de gemeenschap om het te gebruiken en eraan bij te dragen. De code is gebaseerd op het DiskANN-algoritme van Microsoft, dat veelvuldig wordt toegepast in omgevingen waar snelle en schaalbare vectorzoekopdrachten vereist zijn.

De werking van AiSAQ vereist het gebruik van liburing voor asynchrone leesbewerkingen op Linux-systemen, evenals bibliotheken zoals Intel MKL voor geoptimaliseerde compilatie. Er zijn ook versies voor Windows beschikbaar, die compatibel zijn met Visual Studio 2017 en later.

Een Stap Vooruit naar Schaalbare en Duurzame AI

Met de snelle groei van generatieve taalmodellen en architecturen zoals RAG, is het volume van vectorgegevens voor veel organisaties een knelpunt geworden. Kioxia’s focus op SSD-gecentreerde architecturen doorbreekt de afhankelijkheid van DRAM en stelt systemen in staat om schaalbaarder, duurzamer en kosteneffectiever te zijn voor de volgende generatie kunstmatige intelligentietoepassingen.

Deze ontwikkeling onderstreept Kioxia’s toewijding aan het bevorderen van intelligente opslagoplossingen en het stimuleren van efficiënte infrastructuren voor het AI-tijdperk, waarbij de integratie van hardware en software essentieel is om te schalen zonder concessies te doen aan de prestaties.

Bronnen: techpowerup en Kioxia op GitHub.

Scroll naar boven