- جمع النبض 3.9 مليون دولار لتعزيز إعداد البيانات غير المهيكلة لنماذج التعلم الآلي.
- تتناول بدء التشغيل الطلب على Copilots والوكلاء المخصصين باستخدام بيانات المؤسسة الداخلية.
- قاد الرئيس التنفيذي السابق لـ GitHub نات فريدمان ودانييل جروس جولة تمويل البذور للنبض.
جمعت Pulse ، وهي شركة ناشئة من خمسة أشخاص متخصصة في إعداد البيانات غير المهيكلة لنماذج التعلم الآلي ، 3.9 مليون دولار في جولة تمويل بقيادة نات فريدمان ودانييل جروس.
تبيع Pulse الشركات مجموعة أدوات مصممة لتحويل البيانات الخام غير المنظمة إلى تنسيقات جاهزة للاستخدام من قبل نماذج التعلم الآلي. يتناول هذا الطلب المتزايد على الشركات لبناء copilots المخصصة ، و chatbots ، والوكلاء الرقمية المصممة لبياناتها الداخلية.
وقال سيد مانشكانتي ، المؤسس والرئيس التنفيذي لشركة Pulse: “دعنا نقول أنك مؤسسة مالية أو شركة للرعاية الصحية. لا يوجد مجال لـ LLM لصنع شيء ما أو هلوسًا رقمًا أو خطأ”.
قبل النبض ، كان Manchkanti مطور برامج في Nvidia. بدأ الشركة مع صديق طفولته ، ريتفيك باندي ، الذي كان يعمل سابقًا في مشروع تسلا من الحاسبات الفائقة لتدريب نماذج التعلم الآلي ، الذي يطلق عليه Dojo.
يشمل المستثمرون الآخرون في جولة بذرة الشركة Y Combinator و Sequoia Scout و Soma Capital و Siled 2 Ventures و The Venture Capital التي أسسها جو مونتانا وأفراد من Nvidia و Openai و Fintech Startup Ramp.
بيانات التدريب هي المادة الخام التي تمكن نماذج اللغة الكبيرة من تعلم العلاقات بين الكلمات والعبارات وتقليد النص الذي يشبه الإنسان. ومع ذلك ، فإن تدريب هذه النماذج لا يتعلق فقط بتغذية كميات هائلة من المعلومات. يستغرق التنسيق وإعداد المعلومات بالطريقة الصحيحة. أنت لا تضع الديزل في محرك الغاز.
يتم تنظيم البيانات المنظمة وبيانات قابلة للبحث والتي تتناسب بدقة مع الصفوف والأعمدة ، مثل البيانات في جدول بيانات Excel أو سجلات العملاء. تبدو البيانات غير المهيكلة أشبه بالملفات التي تعمل معها يوميًا. فكر في عقود العملاء الطويلة ، وكتيبات الموظفين ، وعروض المبيعات ، ومقاطع الفيديو التجريبية للمنتجات. وفقًا لشركة Intelligence Intelligence IDC ، فإن 90 ٪ من بيانات العالم غير منظمة.
غالبًا ما يشمل تحويل البيانات الفوضوية إلى بيانات التدريب العمال البشريين. قد يقرأون من خلال المستندات والصور ، وإدخال المعلومات ذات الصلة في تنسيقات مثل جداول البيانات أو قواعد البيانات ، ومراجعة البيانات وتنظيفها – تصحيح الأخطاء ووضع تسمية البيانات لتوفير سياق لتطبيقات التعلم الآلي.
لأتمتة هذه العملية ، يستخدم حل Pulse تقنيات رؤية الكمبيوتر ونماذج الاستخلاص الدقيقة لفهم المستندات المعقدة وتحليل بياناتها بدقة.
يقول Manchkanti إن تقنية Pulse لا تبسي فقط العملية – مما يجعلها أسرع وأكثر فاعلية للشركات للاستفادة من بياناتها غير المنظمة في نماذج التعلم الآلي – ولكنها تعمل أيضًا على تحسين الدقة. ويقدر أن الفرق تخسر 20 ٪ إلى 30 ٪ من بياناتها مع الحلول الحالية بسبب سوء الاستخراج.
تعتمد جولة Pulse على مجموعة من الأموال في الشركات الناشئة التي تقدم أدوات للتخلص من عنق الزجاجة غير المهيكلة هذا عنق الزجاجة. جمعت غير منظمة 65 مليون دولار من التمويل حتى الآن وتجاوز ما يزيد عن ألف عميل يدفعون. حصلت Instabase مؤخرًا على 100 مليون دولار من التمويل لتوسيع مجموعة أدواتها لاستخراج ومعالجة البيانات غير المنظمة.
وقال Manchkanti إن الأموال الجديدة التي تم وضعها في Pulse ستسمح للشركة بتوظيف المهندسين وإضافة استخراج البيانات لتنسيقات أخرى ، وهي الصوت والفيديو.
