كيفية تدريب GPT على بيانات Excel مجانا؟ (بيتا)
دليل لإضافة بيانات Excel إلى قاعدة معارف Cody الخاصة بك وتدريب ChatGPT مجانا.
قبل البدء في تدريب Cody على بيانات Excel الخاصة بشركتك ، من الضروري توضيح بعض المفاهيم لضمان أفضل الردود من الروبوت الخاص بك. GPT ، أو المحولات التوليدية المدربة مسبقا ، هي نماذج لغوية مدربة على مجموعات بيانات شاملة للتنبؤ بالكلمة التالية في جملة أو عبارة من أجل إكمالها. يتم تدريبهم بشكل خاص على مجموعات بيانات اللغة الطبيعية التي تضم عينات كبيرة من بيانات المحادثة أو البيانات الحرفية غير المنظمة. على عكس النماذج الإحصائية مثل الانحدار الخطي ، فإن GPTs ليست بارعة في التنبؤ بالأرقام باستخدام بيانات التدريب المنطقية. على سبيل المثال ، إذا قمت بتدريب GPT على مجموعة بيانات تدعي 2 + 2 = 5 ، فسوف تستجيب بالقول إن 2 + 2 = 5 دون محاولة فهم التناقض المنطقي (هذا مجرد مثال ؛ يتعامل OpenAI مع مثل هذه الاستفسارات بردود دقيقة). هذا ، إلى جانب قيد آخر من LLMs ، وهو الهلوسة ، يخلق بيئة غير مناسبة تماما للحسابات الرياضية.
الآن بعد أن فهمت قيود GPT ، دعنا نوجهك خلال عملية تدريب GPT على بيانات Excel مجانا. لقد طورنا طريقة لإضافة بيانات Excel أو CSV إلى قاعدة معارف Cody الخاصة بك. كما ذكرنا سابقا ، تتفوق GPT في فهم اللغة الطبيعية ، لذلك سنقوم بتحويل بيانات Excel إلى تنسيق قابل للقراءة يمكن استهلاكه بسهولة بواسطة نموذج اللغة.
الخطوة 1: تحويل بيانات Excel
احصل على بيانات CSV أو Excel التي تريد تدريب الروبوت عليها وقم بتحويلها إلى ملف نصي باستخدام هذه الأداة التي أنشأناها. تقوم الأداة المساعدة بتحويل بيانات Excel إلى ملف نصي عن طريق التعليق على البيانات برؤوسها المقابلة. من خلال التعليق على عناصر الخلية بالرؤوس ، يتيح لنموذج اللغة فهم السياق بشكل أفضل نظرا لوجود احتمال كبير لتخطي الرؤوس بسبب تجزئة المستند في مرحلة المعالجة المسبقة.
مثل.
بيانات اكسل:
اسم | عمر |
---|---|
John | 16 |
ماري | 18 |
البيانات النصية:
{The Name is ‘John’. The Age is ‘16’.}, {The Name is ‘Marie’. The Age is ‘18’.}
يتبع الملف النصي الذي تم إنشاؤه تنسيقا مشابها ل JSON ولكن بأسلوب أدبي أكثر لتوفير شعور أكثر شبها بالإنسان. على الرغم من أن هذا الحل حاليا في مرحلة تجريبية ولم يتم دمجه بعد في تطبيق Cody ، إلا أنه يعمل بشكل جيد مع جميع طرازات GPT الثلاثة ولكننا نستكشف باستمرار حلولا أفضل لهذا الغرض.
واجهة المنفعة:
عينة من بيانات CSV:
يوصى بتنظيف البيانات قبل التحويل للحصول على أفضل جودة للردود من الروبوت الخاص بك.
بعد تحميل بيانات CSV أو Excel إلى الأداة المساعدة ، يمكنك معاينة البيانات قبل إنشاء ملف نصي متوافق مع GPT.
صفوف لكل جزء: بالنسبة لمجموعات البيانات الأكبر ، ينصح بتقسيم مجموعة البيانات إلى أجزاء متعددة. يعمل هذا التقسيم على تحسين البحث الدلالي وتحسين جودة الردود.
تضمين مراجع الخلايا: إذا كنت تريد أن يتضمن الملف النصي مراجع خلايا Excel، فيمكنك تحديد هذا الخيار. يمكن للروبوت بعد ذلك الرجوع إلى مراجع الخلايا هذه عند إنشاء أدلة خطوة بخطوة للإجراءات التي يمكن تنفيذها في Excel. على سبيل المثال ، يمكنه إنشاء صيغة للعثور على الوسيط.
سيتم إنشاء مجلد مضغوط مضغوط يحتوي على جميع أجزاء بيانات Excel الخاصة بك بتنسيق .txt.
الخطوة 2: إضافة البيانات إلى قاعدة معارف Cody الخاصة بك
لإضافة البيانات المحولة إلى “قاعدة معارف كودي” ، اتبع الخطوات التالية:
- انتقل إلى تطبيق Cody وانتقل إلى قسم “المحتوى”.
- قم بإنشاء مجلد جديد داخل قاعدة المعارف حيث تريد تخزين البيانات.
- بمجرد إنشاء المجلد ، انتقل بداخله.
- انقر فوق الزر “تحميل” لتحميل البيانات المحولة.
- حدد جميع ملفات البيانات المحولة من التخزين المحلي الذي تريد إضافته إلى قاعدة المعارف.
- قم بتأكيد التحديد وابدأ عملية التحميل.
- سيتم تحميل ملفات البيانات المحولة وإضافتها إلى قاعدة معارف Cody ، وتخزينها داخل المجلد الذي قمت بإنشائه. بعد تعلم المستندات بنجاح ، سيتم عرض حالة المستند على أنها “متعلمة”.
الخطوة 3: إعداد شخصية الروبوت
نظرا لأن هذا لا يزال في مرحلة تجريبية ، فإننا نعمل على تحسين المطالبة قبل إضافتها إلى وضع القالب.
فوري:
أنت Data Cody ، محلل بيانات الذكاء الاصطناعي لشركتي. هدفك الأساسي هو إنشاء استنتاجات من بيانات Excel المقدمة لك. يمكن إعطاء مراجع خلايا Excel في شكل $Cell. لا تذكر مرجع الخلية في الردود. المعلومات الواردة في “{}” هي سجل واحد. إذا طلب منك تفاصيل سجل معين ، فقم بإدراجها في مؤشرات.
موجه النظام:
حاول الرد بطريقة شبيهة بالإنسان عندما تسأل عن أي تفاصيل. لا تبرر إجاباتك.
درجة الصلة | واسع / متوازن |
---|---|
توزيع الرمز المميز (السياق – التاريخ – الاستجابة) | 70-10-20 |
استمرار المطالبة | على |
عكس البحث المتجه | قباله |
تعمل هذه العملية بشكل جيد مع جميع طرازات GPT الثلاثة ، لذلك حتى إذا كنت تستخدم الخطة المجانية ، فيمكنك تجربتها. ومع ذلك ، تجدر الإشارة إلى أن نماذج GPT-3.5 16K و GPT-4 تميل إلى فهم البيانات بشكل أفضل. إذا كنت راضيا عن الإجابات التي تتلقاها في الخطة المجانية ولكنك تريد مزيدا من المرونة في تنسيق الردود والقدرة على مقارنة سجلات متعددة ، فقد تكون الترقية إلى GPT-3.5 16K أو GPT-4 مفيدة. تسمح نافذة السياق الإضافية التي توفرها هذه النماذج بإجراء تحليل ومعالجة أكثر شمولا للبيانات.
عرض
مرجع الاستعلام الأول:
مرجع الاستعلام الثاني:
القيود
لا تجعله القدرة على تحميل ملفات Excel أو CSV إلى Cody بديلا مباشرا لأدوات جداول البيانات مثل جداول بيانات Google أو Microsoft Excel. هناك العديد من القيود التي يجب مراعاتها عند التعامل مع البيانات المنظمة في Cody:
- الهلوسة أثناء المهام التحليلية: قد تؤدي المهام التي تتضمن حسابات إحصائية أو تحليلية ، مثل سؤال Cody عن المتوسطات أو المتوسطات أو القيم الدنيا / القصوى ، إلى استجابات غير صحيحة. لا يقوم كودي بإجراء حسابات في الوقت الفعلي ويمكن أن يقدم نتائج غير دقيقة. قد تؤدي تحديثات OpenAI الأخيرة ، مثل مترجم التعليمات البرمجية واستدعاء الوظائف ، إلى تحسين هذا في المستقبل.
- خطأ أثناء مقارنة السجلات: في بعض الحالات ، قد يواجه كودي صعوبات في جلب البيانات من أجزاء مختلفة من المستند ، مما يؤدي إلى ردود تشير إلى أن المعلومات غير متوفرة. هذا السيناريو أكثر احتمالا مع نموذج GPT-3.5 المتاح في الخطة المجانية. تتيح لك الترقية إلى الخطط الأساسية أو المميزة استخدام طراز GPT-3.5 16K أو طراز GPT-4. يحتوي كلا النموذجين على نوافذ سياق أكبر ويمكنهما معالجة هذا القيد.
استنتاج
على الرغم من هذه القيود ، تعد هذه العملية مفيدة بشكل خاص للسيناريوهات التي يتم فيها تخزين بيانات الأسئلة الشائعة الخاصة بعملك أو البيانات الحرفية الأخرى ، مثل بيانات تدريب الموظفين ، بتنسيق Excel أو CSV. يمكن تدريب كودي على هذه البيانات دون الحاجة إلى أي تعديلات. يعمل Cody أيضا بشكل جيد عند جلب تفاصيل سجل واحد أو وصف البيانات أو تقديم اقتراحات بناء على رؤى مستنتجة من مجموعات البيانات الرقمية مثل الميزانيات العمومية أو أرقام المبيعات.
كحل مؤقت لتدريب Cody على بيانات Excel أو CSV ، نقدر تقديرا كبيرا ملاحظاتك على هذا النهج. نحن نقدر مدخلاتك ونشجعك على مشاركة أفكارك معنا على خادم Discord الخاص بنا أو من خلال التواصل معنا من خلال ميزة الحصول على المساعدة . نحن حريصون على سماع تجربتك ومعرفة المزيد من ملاحظاتك. آمل أن تكون قد أحببت نهجنا في تدريب GPT على بيانات Excel مجانا. تحقق من مدوناتنا لمعرفة المزيد عن كودي.