الدردشة مع المستندات
الخطوة التالية في معالجة المعلومات
بدلاً من الاعتماد على مجموعات البيانات العامة والمعرفة العامة، تولّد "الدردشة مع المستندات" إجابات وتحليلات سياقية خاصة بالسياق استناداً إلى مواردك الداخلية الموثوقة. قم بتحميل مستنداتك واستخدم هذه المستندات كقاعدة للإجابة على الأسئلة في الدردشة!
حل قيود البيانات
عند طرح أسئلة على نموذج لغوي، أنت تعتمد على مجموعة البيانات التي تدرب عليها النموذج. عادةً ما تكون هذه معلومات من الإنترنت. من المحتمل أن المصادر غير العامة لا تكون موجودة في هذه المجموعة. باستخدام مستنداتك كمصدر للدردشة، تتأكد من أن لدى النموذج المعلومات التي تحتاجها للإجابة على أسئلتك.
إمكانات مع مستنداتك
يمكنك طرح أسئلة حول مستنداتك مثل ذكر النقاط الرئيسية لمستند أو تلخيص المستند. كما يمكنك أيضاً أن تتيح للنموذج إجراء تحليلات محددة باستخدام مجموعة البيانات الخاصة بك.
عيوب المحادثة المستندة
رفع المستندات ومعالجتها هي خطوات إضافية لا تحتاجها إذا كان بإمكانك الحصول على إجابة مناسبة بدون سياق معلومات محددة. كما أن إنشاء الإجابة يستغرق وقتاً أطول لأن المعلومات اللازمة من المستند يجب استخراجها أولاً قبل إرسال الطلب إلى النموذج اللغوي.
وراء كواليس المحادثة مع المستندات
يتم استخراج النص من المستندات التي ترفعها وتقسيمه إلى مقاطع. لهذه المقاطع عدد محدد من الأحرف (1024 حرفاً) وهناك أيضًا تداخل محدد (128 حرفاً) بين المقاطع. يتم حفظ كل قطعة من النص كـ vector في قاعدة بيانات vectors. مع كل سؤال يتم اختيار بيانات من هذه المعلومات بناءً على التشابه مع السؤال المعروض.
عملية اختيار مقاطع المستند
تم تحويل قطع النص بالفعل إلى متجهات. للمتجهات أبعاد متعددة تشير إلى مدى "التشابه" بين هذا النص ونص آخر. فكر في نظام الألوان RGB. لون له قيمة RGB مشابهة هو لون مشابه أيضًا لكن مختلف. قاعدة البيانات الشعاعية تتيح لنا استرجاع مقاطع النص مرتبة ومفلترة بناءً على السؤال. نحدد أقصى 100 مقطع نصي من 1024 حرفاً لإرسالها مع السؤال.
النماذج المناسبة للدردشة المستندة
لقد اخترنا نماذج ذات نافذة سياق كبيرة لتمكين الدردشة مع المستندات. نود أن نتمكن من إرسال أقصى 100 مقطع نصي من 1024 حرفاً. هذا يزيد عن 100 ألف حرف. استخدم غالباً نموذج لغوي عالي الجودة من الكتالوج المركزي للنماذج.
النماذج المناسبة هي تلك التي لديها مساحة سياق كافية وتحليل مستند جيد، مثل النماذج عالية الجودة من OpenAI، Claude، Google أو EU AI.
اختر واحداً أو أكثر من المستندات
يمكنك تفعيل وضع الملفات بالنقر على مشبك الورق في يمين شريط السؤال. يمكنك اختيار حتى 10 ملفات للدردشة معها.
عند البدء بالدردشة مع المستندات، يتم التحقق مما إذا كان النموذج اللغوي مناسب للدردشة مع المستندات. إذا لم يكن كذلك، يتم اختيار نموذج مناسب تلقائياً من الكتالوج الفعلي.
تستطيع الدردشة مع هذه المستندات طالما وضع الملفات مُفعل.
المعالجة per ملف
بالإضافة إلى الدردشة مع المستندات، يتيح AI-Corporate أيضاً إمكانية تطبيق موجه خاص على كل مستند والحصول على إجابات فردية. هذه الميزة تُسمى المعالجة per ملف.

يمكن استخدام هذه الميزة بالتوازي مع "الدردشة مع الملفات".
سيناريو محتمل
مثال عملي لاستخدام "المعالجة per ملف":
- تقوم بتحميل مستند مرجعي (مثلاً نموذج عقد) وتفعيله مع الدردشة مع الملفات
- تقوم بتحميل مستندات متعددة يجب تحليلها وتفعيله مع المعالجة per ملف
- تصيغ موجه، تُطبق على جميع الملفات بشكل فردي
وبهذه الطريقة يمكن، على سبيل المثال، تحليل جميع العقود تلقائياً استناداً إلى نموذج المرجع.
هناك حد أقصى 30 ملفاً لوظيفة "المعالجة per ملف".
أنواع الملفات المدعومة
يدعم AI-Corporate أنواع ملفات مختلفة للدردشة مع المستندات:
- ملفات PDF تنتهي بـ .pdf
- ملفات Word تنتهي بـ .docx
- ملفات CSV تنتهي بـ .csv
- ملفات JSON تنتهي بـ .json
- ملفات نص ية تنتهي بـ .txt
- ملفات صوت وفيديو بامتدادات 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' أو 'webm'
الدردشة مع ملفات الصوت أو الفيديو
بالنسبة لملفات الصوت أو الفيديو، يقوم AI-Corporate أولاً بنسخ الملف عبر مزود النسخ المكوّن، مثل OpenAI أو الذكاء الاصطناعي الأوروبي. تأتي النماذج الفعلية من كتالوج النماذج المركزي.
في المحادثات يمكن أن يتضمن النسخ كتل زمنية وتسميات للمتحدثين عندما يدعم النموذج ذلك. بعد ذلك يمكن لنموذج نص مناسب تصحيح علامات الترقيم والإملاء وتسميات المتحدثين والمصطلحات المتخصصة.
بعد النسخ تُستخدم نفس العملية كما في ملفات PDF أو Word.
لنماذج الصوت والفيديو حدود تختلف حسب المزود والنموذج لحجم الملف ومدته. لذلك قد تُعالج الملفات الطويلة بطريقة مختلفة. إذا فشلت المعالجة، تحقق من حالة الملف وحاول المعالجة مجدداً أو قدمه في أجزاء أصغر.
ملفات يمكنك تنزيلها كأمثلة
مثال تقرير شركة مثال خطة مشروع مستند تاريخ كبير
معالجة الملفات وإعادة استخدامها
سيتم معالجة الملفات التي ترفعها قبل أن يتمكن AI-Corporate من استخدام محتواها في المحادثات والمساعدين وتدفقات العمل. إذا فشل المعالجة، سيُعطى الملف حالة خطأ ويمكنك إعادة رفعه أو إعادة معالجته من خلال إدارة الملفات.
بالنسبة لملفات PDF يمكن لـ AI-Corporate استخدام طبقة النص العادية، وإذا لزم الأمر إجراء تحليل PDF أكثر تفصيلاً. هذا مفيد للمستندات الممسوحة ضوئياً، النماذج المملوءة، الملاحظات المكتوبة بخط اليد، الاختيارات المرسومة أو المسطرة، الجداول والمعلومات البصرية. يمكن تقسيم الملفات الكبيرة إلى أجزاء أصغر أثناء المعالجة.
عندما يطلب نموذج أو إجراء تدفق عمل ملفاً، يمكنك رفع ملف جديد أو اختيار ملف موجود من خلال مدير الوسائط. الملفات المضافة عبر مثل هذا النموذج تكون متاحة للمساعد في تلك الدردشة، لكنها لا تُستخدم تلقائياً للإجابات الشائعة.
دعم Markdown ملفات بامتداد .md.