Chat mit Dokumenten
Der nächste Schritt in der Informationsverarbeitung
Anstatt sich auf öffentliche Datensätze und allgemeines Wissen zu verlassen, generiert "Chat mit Dokumenten" kontextspezifische Antworten und Analysen basierend auf Ihren vertrauten internen Quellen. Laden Sie Ihre Dokumente hoch und verwenden Sie diese als Grundlage für Fragen im Chat!
Lösung von Dateneinschränkungen
Wenn Sie einem Sprachmodell Fragen stellen, sind Sie von dem Datensatz abhängig, mit dem das Modell trainiert wurde. Dies sind in der Regel Informationen, die aus dem Internet stammen. Nicht-öffentliche Quellen sind in diesem Datensatz wahrscheinlich nicht enthalten. Indem Sie Ihre Dokumente als Quelle für den Chat verwenden, stellen Sie sicher, dass das Modell über die Informationen verfügt, die Sie zum Beantworten Ihrer Fragen benötigen.
Möglichkeiten mit Ihren Dokumenten
Sie können Fragen zu Ihren Dokumenten stellen, wie das Auflisten der Hauptpunkte eines Dokuments oder das Zusammenfassen des Dokuments. Auch können Sie vom Sprachmodell spezifische Analysen mit Hilfe Ihres eigenen Datensatzes durchführen lassen.
Nachteile des dokumentbasierten Chats
Das Hochladen und Verarbeiten von Dokumenten sind zusätzliche Schritte, die Sie nicht unternehmen müssen, wenn Sie auch ohne den Kontext spezifischer Informationen gute Antworten erhalten können. Auch dauert es länger, eine Antwort zu generieren, da zunächst die erforderlichen Informationen aus dem Dokument abgerufen werden müssen, bevor die Anfrage an das Sprachmodell gesendet werden kann.
Hinter den Kulissen des Chats mit Dokumenten
Der Text aus den von Ihnen hochgeladenen Dokumenten wird extrahiert und in Stücke unterteilt. Diese Stücke haben eine feste Anzahl von Zeichen (1024 Zeichen), und wir haben auch eine Überlappung (128 Zeichen) zwischen den Stücken festgelegt. Jedes Textstück wird als Vektor in einer Vektordatenbank gespeichert. Bei jeder Frage wird aus diesen Daten eine Auswahl basierend auf der Ähnlichkeit mit der gestellten Frage getroffen.
Auswahlprozess von Dokumentfragmenten
Die Textstücke wurden bereits in Vektoren umgewandelt. Vektoren haben mehrere Dimensionen, die angeben, wie "gleich" dieser Text zu anderen Texten ist. Denken Sie an das RGB-Farbsystem. Eine Farbe mit einem ähnlichen RGB-Wert ist auch eine ähnliche Farbe, aber leicht anders. Die Vektordatenbank ermöglicht es uns, die Textstücke basierend auf der gestellten Frage geordnet und gefiltert abzurufen. Wir wählen maximal 100 Textstücke von 1024 Zeichen aus, um sie mit der Frage zu senden.
Geeignete Modelle für dokumentbasierten Chat
Wir haben Modelle mit großem Kontextfenster ausgewählt, um das Chatten mit Dokumenten zu ermöglichen. Verwenden Sie dafür vorzugsweise ein hochwertiges Sprachmodell aus dem zentralen Modellkatalog.
Geeignete Modelle haben ausreichend Kontextkapazität und gute Dokumentanalyse, zum Beispiel die hochwertigen Modelle von OpenAI, Claude, Google oder Europäischer KI.
Wählen Sie ein oder mehrere Dokumente
Sie können den Dateimodus aktivieren, indem Sie auf die Büroklammer rechts neben der Fragezeile klicken. Sie können bis zu 10 Dateien zum Chatten auswählen.
Wenn das gewählte Modell nicht geeignet ist, wird automatisch ein geeignetes Modell aus dem aktuellen Katalog ausgewählt.
Sie chatten mit diesen Dokumenten, solange der Dateimodus aktiviert ist.
Pro Datei verarbeiten
Neben dem Chatten mit Dokumenten bietet AI-Corporate auch die Möglichkeit, einen Prompt separat auf jedes Dokument anzuwenden und individuelle Antworten zu erhalten. Diese Funktion heißt Pro Datei verarbeiten.

Diese Funktion kann in Kombination mit "Chat mit Dateien" verwendet werden.
Mögliches Szenario
Ein praktisches Beispiel für die Verwendung von "Pro Datei verarbeiten":
- Sie laden ein Referenzdokument (z.B. eine Vertragsvorlage) hoch und aktivieren es bei Chat mit Dateien
- Sie laden mehrere Dokumente hoch, die analysiert werden müssen, und aktivieren sie bei Pro Datei verarbeiten
- Sie formulieren einen Prompt, der auf alle Dateien einzeln angewendet wird
Auf diese Weise können Sie beispielsweise alle Verträge automatisch auf Basis der Referenzvorlage analysieren lassen.
Es gilt ein Maximum von 30 Dateien für die Funktion "Pro Datei verarbeiten".
Unterstützte Dateitypen
AI-Corporate unterstützt verschiedene Dateitypen für das Chatten mit Dokumenten:
- PDF-Dateien mit der Endung .pdf
- Word-Dateien mit der Endung .docx
- CSV-Dateien mit der Endung .csv
- JSON-Dateien mit der Endung .json
- Textdateien mit der Endung .txt
- Audio- und Videodateien mit den Erweiterungen 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' oder 'webm'
Mit Audio- oder Videodateien chatten
Bei Audio- oder Videodateien transkribiert AI-Corporate die Datei zuerst über den konfigurierten Transkriptionsanbieter, zum Beispiel OpenAI oder Europäische KI. Die konkreten Modelle stammen aus dem zentralen Modellkatalog.
Bei Gesprächen kann die Transkription Zeitblöcke und Sprecherlabels enthalten, wenn das gewählte Modell dies unterstützt. Danach kann ein geeignetes Textmodell Zeichensetzung, Rechtschreibung, Sprecherlabels und Fachbegriffe korrigieren.
Nach der Transkription gilt derselbe Ablauf wie bei PDF- oder Word-Dokumenten.
Audio- und Videomodelle haben je nach Anbieter und Modell unterschiedliche Grenzen für Dateigröße und Dauer. Lange Dateien können daher anders verarbeitet werden als kurze Dateien. Wenn die Verarbeitung fehlschlägt, prüfe den Dateistatus und versuche es erneut oder liefere die Datei in kleineren Teilen.
Dateien, die Sie als Beispiel herunterladen können
Beispiel Geschäftsbericht Beispiel Projektplan Umfangreiches Geschichtsdokument
Dateiverarbeitung und Wiederverwendung
Hochgeladene Dateien werden zuerst verarbeitet, bevor AI-Corporate ihre Inhalte in Chats, Assistenten und Workflows verwenden kann. Wenn die Verarbeitung fehlschl?gt, erh?lt die Datei einen Fehlerstatus und kann erneut hochgeladen oder in der Dateiverwaltung erneut verarbeitet werden.
Bei PDFs kann AI-Corporate die normale Textebene verwenden und bei Bedarf eine umfassendere PDF-Analyse durchf?hren. Das ist hilfreich bei gescannten Dokumenten, ausgef?llten Formularen, handschriftlichen Notizen, eingekreisten oder unterstrichenen Antworten, Tabellen und visuellen Informationen. Gro?e PDFs k?nnen w?hrend der Verarbeitung in kleinere Teile aufgeteilt werden.
Wenn ein Formular oder Workflow eine Datei ben?tigt, k?nnen Sie eine neue Datei hochladen oder eine vorhandene Datei aus dem Medienmanager ausw?hlen. Dateien, die ?ber ein solches Formular hinzugef?gt werden, stehen dem Assistenten f?r diesen Chat zur Verf?gung, werden aber nicht automatisch f?r normale Chatfragen ausgew?hlt.
Markdown-Dateien mit der Erweiterung .md werden ebenfalls unterst?tzt.