بیشتر

د ویکتور ډیټابیسونه څه دي، دوی څنګه کار کوي او احتمالي بازار

د ویکتور ډیټابیس یو ډول ډیټابیس دی چې ډیټا د لوړ ابعادي ویکتورونو په توګه ذخیره کوي ، کوم چې د ځانګړتیاو یا ځانګړتیاو ریاضياتي نمایشونه دي. 

دا ویکتورونه معمولا د خام ډیټا لپاره د یو ډول ایمبیډینګ فعالیت پلي کولو سره رامینځته کیږي ، لکه متن ، عکسونه ، آډیو ، ویډیو او نور.

د ویکتور ډیټابیسونه کیدی شي defiد یوې وسیلې په توګه نیټ شوی چې د ګړندي ترلاسه کولو او ورته والي لټون لپاره د ویکتور سرایتونه شاخص او ذخیره کوي ، د ځانګړتیاو سره لکه د میټاډاټا فلټرینګ او افقی اندازه کول.

د لوستلو اټکل شوی وخت: 9 منیوټ

د پانګوالو د علاقې وده

په دې وروستیو اونیو کې، د ویکٹر ډیټابیسونو کې د پانګوالو په ګټو کې زیاتوالی راغلی. د 2023 له پیل راهیسې موږ ولیدل چې:

  • د ویکتور ډیټابیس پیل کول اوبدل هغه ترلاسه کړ د B لړۍ تمویل کې 50 ملیون ډالر;
  • پنکون د 100 ملیون ډالرو په ارزښت د B لړۍ تمویل کې 750 ملیون ډالر راټول کړي؛
  • کروما د خلاصې سرچینې پروژه، د ډیټابیس د ځای پرځای کولو لپاره 18 ملیون ډالر راټول کړي؛

راځئ چې په ډیر تفصیل سره وګورو چې د ویکتور ډیټابیسونه څه دي.

ویکتورونه د معلوماتو نمایندګي په توګه

د ویکتور ډیټابیسونه په پراخه کچه د ویکتور ایمبیډینګ باندې تکیه کوي ، د ډیټا نمایندګي یو ډول دی چې پدې کې د AI لپاره مهم سیمانټیک معلومات لیږدوي ترڅو پوهه ترلاسه کړي او اوږدمهاله حافظه وساتي ترڅو د پیچلو فعالیتونو اجرا کولو پرمهال راجلب کړي. 

ویکتور سرایت کوي

د ویکتور سرایتونه د نقشې په څیر دي ، مګر د دې پرځای چې موږ ته وښیې چې شیان په نړۍ کې چیرې دي ، دوی موږ ته ښیې چې شیان په کوم شی کې دي. د ویکتور ځای. د ویکتور ځای یو ډول د لوبو لوی ډګر دی چیرې چې هرڅه د لوبې کولو ځای لري. تصور وکړئ چې تاسو د څارویو یوه ډله لرئ: پیشو، سپی، مرغۍ او کب. موږ کولی شو د لوبې په ډګر کې د ځانګړي موقعیت په ورکولو سره د هر عکس لپاره ویکتور سرایت جوړ کړو. پیشو کیدای شي په یوه کونج کې وي، سپی بل لوري ته. مرغۍ په اسمان کې کیدای شي او کب په حوض کې وي. دا ځای یو څو اړخیز ځای دی. هر ابعاد د دوی مختلف اړخونو سره مطابقت لري، د بیلګې په توګه، کبونه پښې لري، مرغۍ وزرونه لري، پیشوګانې او سپي پښې لري. د دوی بل اړخ ښايي دا وي چې کب په اوبو پورې اړه لري، مرغان په عمده توګه اسمان ته او پیشوګانې او سپي ځمکې ته. یوځل چې موږ دا ویکتورونه ولرو، موږ کولی شو د ریاضياتي تخنیکونو څخه کار واخلو ترڅو د دوی د ورته والي پر بنسټ ګروپ کړو. د هغو معلوماتو پر بنسټ چې موږ یې لرو،

نو، د ویکتور سرایتونه د یوې نقشې په څیر دي چې موږ سره د ویکتور ځای کې د شیانو ترمنځ ورته والي موندلو کې مرسته کوي. لکه څنګه چې یوه نقشه له موږ سره د نړۍ په حرکت کې مرسته کوي، د ویکتور سرایتونه د ویکتور لوبې ډګر ته د تګ سره مرسته کوي.

کلیدي مفکوره دا ده چې هغه سرایتونه چې په معنی ډول یو بل سره ورته دي د دوی ترمینځ لږ واټن لري. د دې د موندلو لپاره چې دوی څومره ورته دي، موږ کولی شو د ویکتور فاصله افعال وکاروو لکه د یوکلیډین فاصله، د کوزین فاصله، او نور.

د ویکتور ډیټابیسونه د ویکتور کتابتونونه

د ویکتور کتابتونونه په حافظه کې په شاخصونو کې د ویکتورونو سرایت ذخیره کړئ، د ورته لټونونو ترسره کولو لپاره. د ویکتور کتابتونونه لاندې ځانګړتیاوې/محدودیتونه لري:

  1. یوازې ویکتورونه ذخیره کړئ : د ویکتور کتابتونونه یوازې د ویکتورونو سرایت ذخیره کوي نه هغه اړوند توکي چې له هغې څخه تولید شوي. دا پدې مانا ده چې کله چې موږ پوښتنه کوو، د ویکتور کتابتون به د اړونده ویکتورونو او اعتراض IDs سره ځواب ووايي. دا محدود دی ځکه چې حقیقي معلومات په اعتراض کې زیرمه شوي نه په id کې. د دې ستونزې د حل لپاره، موږ باید شیان په ثانوي ذخیره کې ذخیره کړو. بیا موږ کولی شو هغه IDs وکاروو چې د پوښتنې لخوا بیرته راستانه شوي او د پایلو د پوهیدو لپاره یې د شیانو سره سمون خوري.
  2. د شاخص معلومات بدلیدونکي دي : د ویکتور کتابتونونو لخوا تولید شوي شاخصونه د بدلون وړ ندي. دا پدې مانا ده چې یوځل چې موږ خپل ډیټا وارد کړو او شاخص جوړ کړو، موږ نشو کولی کوم بدلون راوړو (نوي داخلول، حذف کول، یا بدلونونه). زموږ په شاخص کې د بدلون راوستلو لپاره، موږ باید دا له پیل څخه بیا جوړ کړو
  3. د وارداتو د محدودولو پر مهال پوښتنه : د ډیټا واردولو په وخت کې ډیری ویکتور کتابتونونه نشي پوښتل کیدی. موږ باید لومړی زموږ ټول ډیټا توکي وارد کړو. نو شاخص د توکو واردولو وروسته رامینځته کیږي. دا د غوښتنلیکونو لپاره ستونزه کیدی شي چې ملیونونه یا حتی ملیارد توکي واردولو ته اړتیا لري.

د ویکتور لټون ډیری کتابتونونه شتون لري: د فیسبوک د FAISS، ناراض د Spotify او سکین این این د ګوګل لخوا. FAISS د کلستر کولو میتود کاروي، Annoy ونې کاروي او ScanNN د ویکتور کمپریشن کاروي. د هر یو لپاره د فعالیت سوداګرۍ بند شتون لري، کوم چې موږ کولی شو زموږ د غوښتنلیک او فعالیت میټریکونو پراساس غوره کړو.

CRUD

اصلي ځانګړتیا چې د ویکتور ډیټابیسونه د ویکتور کتابتونونو څخه توپیر کوي د ډیټا آرشیف کولو ، تازه کولو او حذف کولو وړتیا ده. د ویکتور ډیټابیس د CRUD ملاتړ لري بشپړ (جوړول، لوستل، تازه کول او حذف کول) چې د ویکتور کتابتون محدودیتونه حل کوي.

  1. ویکتورونه او توکي آرشیف کړئ : ډیټابیس کولی شي دواړه ډیټا شیان او ویکتورونه ذخیره کړي. څرنګه چې دواړه زیرمه شوي، موږ کولی شو د ویکتور لټون د جوړښت شوي فلټرونو سره یوځای کړو. فلټرونه موږ ته اجازه راکوي چې ډاډ ترلاسه کړو چې نږدې ګاونډیان د میټاډاټا فلټر سره سمون لري.
  2. بدلون : لکه څنګه چې د ویکتور ډیټابیس بشپړ ملاتړ کوي خام، موږ کولی شو په اسانۍ سره زموږ په شاخص کې ننوتنې اضافه ، لرې یا تازه کړو وروسته له دې چې دا رامینځته شي. دا په ځانګړې توګه ګټور دی کله چې په دوامداره توګه د معلوماتو بدلولو سره کار کوي.
  3. د ریښتیني وخت لټون : د ویکتور کتابتونونو برعکس، ډیټابیسونه موږ ته اجازه راکوي چې د وارداتو پروسې په جریان کې زموږ ډاټا پوښتنې او تعدیل کړو. لکه څنګه چې موږ په ملیونونو توکي بار کوو، وارد شوي ډیټا په بشپړ ډول د لاسرسي وړ او فعال پاتې کیږي، نو تاسو اړتیا نلرئ د واردات بشپړیدو ته انتظار وکړئ ترڅو د هغه څه په اړه کار پیل کړئ چې دمخه شتون لري.

په لنډه توګه، د ویکتور ډیټابیس د ویکتور سرایتونو اداره کولو لپاره غوره حل وړاندې کوي د ځان سره د ویکتور شاخصونو محدودیتونو په نښه کولو سره لکه څنګه چې په تیرو ټکو کې بحث شوی.

مګر څه شی د ویکتور ډیټابیسونه د دودیزو ډیټابیسونو څخه غوره کوي؟

د ویکتور ډیټابیسونه د دودیزو ډیټابیسونو په مقابل کې

دودیز ډیټابیسونه د اړونده ماډلونو په کارولو سره د جوړښت شوي ډیټا ذخیره کولو او ترلاسه کولو لپاره ډیزاین شوي ، پدې معنی چې دوی د معلوماتو د کالمونو او قطارونو پراساس پوښتنو لپاره مطلوب دي. پداسې حال کې چې دا ممکنه ده چې په دودیز ډیټابیسونو کې د ویکتور سرایتونه ذخیره کړئ، دا ډیټابیسونه د ویکتور عملیاتو لپاره مطلوب ندي او نشي کولی په لوی ډیټاسیټونو کې د ورته لټون یا نور پیچلي عملیات په اغیزمنه توګه ترسره کړي.

دا ځکه چې دودیز ډیټابیسونه د ساده ډیټا ډولونو لکه تارونو یا شمیرو پراساس د شاخص کولو تخنیکونه کاروي. دا د شاخص کولو تخنیکونه د ویکتور ډیټا لپاره مناسب ندي، کوم چې لوړ ابعاد لري او د شاخص کولو ځانګړي تخنیکونو ته اړتیا لري لکه د انډول شوي شاخصونه یا ځایي ونې.

همدارنګه، دودیز ډیټابیسونه د لوی مقدار غیر منظم یا نیمه جوړښت شوي ډیټا اداره کولو لپاره ډیزاین شوي ندي چې ډیری وختونه د ویکتور سرایتونو سره تړاو لري. د مثال په توګه، یو انځور یا آډیو فایل کولی شي د ملیونونو ډیټا پوائنټونه ولري، کوم چې دودیز ډیټابیس نشي کولی په اغیزمنه توګه اداره کړي.

له بلې خوا د ویکتور ډیټابیسونه په ځانګړي ډول د ویکتور ډیټا ذخیره کولو او ترلاسه کولو لپاره ډیزاین شوي او په لوی ډیټاسیټونو کې د ورته لټونونو او نورو پیچلو عملیاتو لپاره غوره شوي. دوی د ځانګړي شاخص کولو تخنیکونه او الګوریتمونه کاروي چې د لوړ ابعادي ډیټا سره کار کولو لپاره ډیزاین شوي ، دوی د ویکتور سرایتونو ذخیره کولو او ترلاسه کولو لپاره د دودیزو ډیټابیسونو په پرتله خورا اغیزمن کوي.

اوس چې تاسو د ویکتور ډیټابیسونو په اړه ډیر څه لوستلي، تاسو شاید حیران یاست، دوی څنګه کار کوي؟ راځئ چې یو نظر واخلو.

د ویکتور ډیټابیس څنګه کار کوي؟

موږ ټول پوهیږو چې اړونده ډیټابیسونه څنګه کار کوي: دوی په قطارونو او کالمونو کې تارونه، شمیرې، او د سکیلر ډیټا نور ډولونه ذخیره کوي. له بلې خوا، د ویکتور ډیټابیس په ویکتورونو کار کوي، نو د دې غوره کولو او پوښتل طریقه خورا توپیر لري.

په دودیز ډیټابیسونو کې، موږ معمولا په ډیټابیس کې د قطارونو لپاره پوښتنه کوو چیرې چې ارزښت معمولا زموږ د پوښتنې سره سمون لري. د ویکتور ډیټابیسونو کې، موږ د ویکتور موندلو لپاره د ورته والی میټریک پلي کوو چې زموږ د پوښتنې سره ورته وي.

د ویکتور ډیټابیس د څو الګوریتمونو ترکیب کاروي چې ټول د نږدې ګاونډي لټون (ANN) کې برخه اخلي. دا الګوریتمونه د هش کولو، مقدار کولو یا ګراف پر بنسټ لټون له لارې لټون غوره کوي.

دا الګوریتمونه په پایپ لاین کې راټول شوي چې د پوښتل شوي ویکتور ګاونډیو ګړندۍ او دقیق ترلاسه کول چمتو کوي. څرنګه چې د ویکتور ډیټابیس نږدې پایلې وړاندې کوي، اصلي تجارت چې موږ یې په پام کې نیسو د دقت او سرعت ترمنځ دي. څومره چې پایله دقیقه وي، پوښتنه به ورو وي. په هرصورت، یو ښه سیسټم کولی شي د نږدې بشپړ درستیت سره خورا چټک لټون چمتو کړي.

  • شاخص کول : د ویکتور ډیټابیس د الګوریتم په کارولو سره ویکتورونه شاخص کوي لکه PQ، LSH یا HNSW. دا ګام ویکتورونه د ډیټا جوړښت سره شریکوي کوم چې د ګړندي لټون لپاره اجازه ورکوي.
  • پوښتنلیک : د ویکتور ډیټابیس په ډیټاسیټ کې د شاخص شوي ویکتورونو سره د شاخص شوي پوښتنې ویکتور پرتله کوي ترڅو نږدې ګاونډیان ومومي (د ورته شاخص لخوا کارول شوي ورته میټریک پلي کول)
  • وروسته پروسس کول : په ځینو حاالتو کې، د ویکتور ډیټابیس وروستی نږدې ګاونډیان د ډیټا سیټ څخه راوړي او وروسته پروسس کوي ترڅو وروستۍ پایلې بیرته راولي. پدې مرحله کې ممکن د مختلف ورته والی اندازه په کارولو سره د نږدې ګاونډیانو بیا طبقه بندي شامل وي.

ګټې

د ویکتور ډیټابیسونه په لویو ډیټا سیټونو کې د ورته لټونونو او نورو پیچلو عملیاتو لپاره قوي وسیله ده ، کوم چې د دودیزو ډیټابیسونو په کارولو سره په مؤثره توګه نشي ترسره کیدی. د فعال ویکتور ډیټابیس جوړولو لپاره، ایمبیډونه اړین دي، ځکه چې دوی د ډیټا سیمانټیک معنی نیسي او د سم ورته ورته لټون وړ کوي. د ویکتور کتابتونونو برعکس، د ویکتور ډیټابیسونه زموږ د کارونې قضیې سره سمون لپاره ډیزاین شوي، دوی د غوښتنلیکونو لپاره مثالی کوي چیرې چې فعالیت او اندازه کول مهم دي. د ماشین زده کړې او مصنوعي استخباراتو په ډیریدو سره، د ویکتور ډیټابیسونه د غوښتنلیکونو پراخه لړۍ لپاره په زیاتیدونکې توګه مهم کیږي پشمول د وړاندیز کونکي سیسټمونه، د عکس لټون، سیمانټیک ورته والی او لیست پرمخ ځي. لکه څنګه چې ساحه پرمختګ ته دوام ورکوي، موږ تمه کولی شو چې په راتلونکي کې د ویکتور ډیټابیسونو نور نوښت غوښتنلیکونه وګورو.

Ercole Palmeri

د نوښت خبر پاڼه
د نوښت په اړه خورا مهم خبرونه له لاسه مه ورکوئ. د بریښنالیک له لارې دوی ترلاسه کولو لپاره لاسلیک وکړئ.

وروستي مقالې

خپرونکي او OpenAI تړونونه لاسلیک کوي ترڅو د مصنوعي استخباراتو لخوا پروسس شوي معلوماتو جریان تنظیم کړي

تیره دوشنبه، فایننشل ټایمز د OpenAI سره یوه معامله اعلان کړه. FT د نړۍ په کچه ژورنالیزم جواز ورکوي ...

30 اپریل 2024

آنلاین تادیات: دلته د سټیمینګ خدمات تاسو ته د تل لپاره تادیه کوي

ملیونونه خلک د سټیمینګ خدماتو لپاره تادیه کوي ، د میاشتنۍ ګډون فیس ورکوي. دا عام نظر دی چې تاسو…

29 اپریل 2024

Veeam د ransomware لپاره خورا پراخه ملاتړ وړاندې کوي ، له محافظت څخه تر غبرګون او رغیدو پورې

د Veeam لخوا Coveware به د سایبر غصب پیښو غبرګون خدماتو چمتو کولو ته دوام ورکړي. Coveware به د عدلي او درملنې وړتیاوې وړاندې کړي ...

23 اپریل 2024

شنه او ډیجیټل انقلاب: د وړاندوینې وړ ساتنه څنګه د تیلو او ګاز صنعت بدلوي

د وړاندوینې ساتنه د تیلو او ګاز سکتور کې انقلاب رامینځته کوي ، د نبات مدیریت لپاره د نوښت او فعال چلند سره.

22 اپریل 2024

نوښت په خپله ژبه ولولئ

د نوښت خبر پاڼه
د نوښت په اړه خورا مهم خبرونه له لاسه مه ورکوئ. د بریښنالیک له لارې دوی ترلاسه کولو لپاره لاسلیک وکړئ.

مونږ سره په