Seminar #28535 im Modul Methoden: Wissenschaftstheoretische Grundlagen, Datenerhebung und Statistik, Sommersemester 2024
Freie Universität Berlin
25. 05. 2024
Check-in
Wiederholung: Operationalisierung in der Inhaltsanalyse: Kategoriensystem und Codebuch
Operationalisierung in der Zero-Shot-Inhaltsanalyse: Vom Codebuch zum Prompt
Kommunikation mit der OpenAI API
Aufgaben bis zur nächsten Woche
Zum Abtippen: https://bachl.quarto.pub/inhaltsanalyse_mit_ki_s07/
Link und PDF auf Blackboard
Ausführliche Beschreibung in Rössler (2017), Kapitel 6-9
Beispiel-Codebuch zum Lehrbuch
Zentraler Unterschiede zu automatisierten Verfahren:
Prompt: Anweisung an ein KI-Modell, wie es eine bestimmte Aufgabe lösen soll.
Wird in menschlicher Sprache formuliert
Muss berücksichtigen, dass es trotzdem an ein Computermodell gerichtet ist
Kontext: Einleitung, Hintergrundinformationen, Definitionen, ggf. Rolle
Aufgabe: Klassifikationsaufgabe mit spezifischen Ausprägungen
Einschränkungen: Vorgaben, wie die Antwort strukturiert sein soll
Wichtig
Zwischenüberschriften sind nicht Teil des Prompts! Die Formatierung dient nur der Übersichtlichkeit. Prompt wird als unformatierter Text an Modell gesendet.
Your task is to evaluate whether a comment contains incivility.
Incivility is defined as a statement that contains any of the following features: Vulgarity, Inappropriate Language, Swearing, Insults, Name Calling, Profanity, Dehumanization, Sarcasm, Mockery, Cynicism, Negative Stereotypes, Discrimination, Threats of Violence, Denial of Rights, Accusations of Lying, Degradation, Disrespect, Devaluation.
You should assign the comment a numeric label, 1 or 0.
1
The comment is incivil. It contains any of the mentioned features.
0
The comment is civil. It does not contain any of the mentioned features.
Answer in JSON format with the template below.
Wichtig
Zwischenüberschriften sind nicht Teil des Prompts! Die Formatierung dient nur der Übersichtlichkeit. Prompt wird als unformatierter Text an Modell gesendet.
You have two tasks. Your first task is to evaluate whether a comment contains incivility.
Incivility is defined as a statement that contains any of the following features: Vulgarity, Inappropriate Language, Swearing, Insults, Name Calling, Profanity, Dehumanization, Sarcasm, Mockery, Cynicism, Negative Stereotypes, Discrimination, Threats of Violence, Denial of Rights, Accusations of Lying, Degradation, Disrespect, Devaluation.
You should assign a numeric label, 1 or 0.
1
The comment is incivil. It contains any of the mentioned features.
0
The comment is civil. It does not contain any of the mentioned features.
Your second task is to guess the gender of the person to whom the comment refers.
You should assign a numeric label, 1, 2, 3, or 4.
1
male
2
female
3
non-binary or other
4
unknown
For each task, report the label and the motivation why you chose the label. Answer in JSON format with the template below.
Tipp
Es gibt mittlerweile unzählige Leitfäden und sogar Kurse zu diesem Thema. Die wenigsten basieren auf empirischer Evidenz. Auch ist offen, inwiefern sie Gültigkeit für neuere Modelle haben. Hinweise wie die Folgenden können der Orientierung dienen, müssen aber nicht immer und unreflektiert befolgt werden.
Ausgangspunkt: Beschreibung der Kategorien und Ausprägungen für menschliche Codierung
Struktur und Reihenfolge: Kontext, Aufgabe, Einschränkungen
Nummerierungen und Listen
“Keine Angabe”, “Unbekannt”, “Sonstiges” oder ähnliche Ausprägungen erwägen
Ausgabe im JSON-Format
KI-Tools zur Verbesserung von Prompts verwenden
Verhältnis von Kürze (Kosten, Fokus) und Genauigkeit beachten
Chain-of-Thought: Schrittweises Bearbeiten von Aufgaben mit nennen von Zwischenergebnissen. Vor allem für sehr komplexe, mehrteilige Aufgaben empfohlen. Aufwändig und vergleichsweise teuer.
Sprache: Englischsprachige Prompts tendenziell besser
Few-Shot-Klassifikation: Beispiele geben; Abwägung: Konkretere Beschreibung vs. Einengung der Bedeutung des Konstrukts
No code: Shiny App: Blackboard🔒, Web; BITTE NUR NUTZEN, WENN KEINE ANDERE MÖGLICHKEIT BESTEHT
Few code: Vorbereitetes R-Skript: Blackboard🔒
Own code: OpenAI API ist sehr gut dokumentiert: Guide, API Reference
Aufgaben
Marko Bachl