Norm: DIN EN ISO 9241-154

Beschreibung

Verweis auf Übersichtsnorm DIN EN ISO 9241 (ff.)

Einführungsbeitrag

Interaktive Sprachdialogsysteme (IVR, en: interactive voice response) sind seit den späten 1980er Jahren ein verbreitetes Mittel im Kundenservice. Diese Systeme wurden gestaltet, um die Notwendigkeit von Telefonschleifen bei der Kundenbetreuung zu reduzieren oder zu beseitigen, indem viele der Funktionen automatisiert wurden, die üblicherweise von Menschen bei der Kundenbetreuung am Telefon bei der Bearbeitung von Kundentransaktionen geleistet wurden. Somit können Benutzer (das heißt Anrufer) Tätigkeiten wie das Abfragen von Zugfahrplänen, Buchbestellungen, Berichte über Probleme mit dem Kabelfernsehen durch Interaktion mit einem Sprachdialogsystem ausführen. Zusätzlich haben Sprachdialogsysteme häufig eine automatische Anrufweiterleitungsfunktion, damit der Anrufer mit der richtigen Stelle für seine spezifische Anfrage verbunden werden kann. DIN EN ISO 9241-154 beschäftigt sich weitgehend mit der Gestaltung des Dialogs zwischen Mensch und Sprachdialogsystem. Benutzer interagieren mit dem Sprachdialogsystem üblicherweise entweder über Spracheingabe oder über Tonwahl (DTMF) über das Telefontastenfeld. Wenn ein Sprachdialogsystem sprachgesteuert ist, verwendet es eine automatische Spracherkennungskomponente (ASR), die die Spracheingabe des Anrufers erkennt. Wenn es nicht sprachgesteuert ist, erkennt es üblicherweise nur Tonwahleingaben über das Telefontastenfeld oder manchmal Texttelefon-Eingaben (TTY). Sprachgesteuerte Sprachdialogsysteme sind eine relativ neue Entwicklung, und viele Systeme werden nun so gestaltet, dass sie beim Dialog mit einem Anrufer sowohl Tonwahl als auch Sprache erkennen. Das Sprachdialogsystem reagiert über Hardware und/oder Software, die dem Anrufer synthetische, digitalisierte oder aufgezeichnete Sprache vorspielt und zusätzlich nicht-sprachliche akustische Ausgaben ermöglicht. Die Tatsache, dass bei diesen Anwendungen keine visuelle Informationsanzeige vorhanden ist, stellt eine Herausforderung für die Dialoggestalter dar, weil das Navigieren durch die Anwendung sowie die Verarbeitung und das Erinnern der relevanten Informationen ohne Hilfe einer visuellen Anzeige eine Belastung für den Anrufer bedeutet.

DIN EN ISO 9241-154 enthält Festlegungen zu Sprachdialogsystemen (IVR), die eine Kombination von Sprachtechnologien umfassen können, sich jedoch durch die Anwendung des Telefons als Informationsübertragungsmechanismus auszeichnen. Diese Festlegungen setzen keine visuellen Informationsanzeigen außer der Beschriftung auf den Tastenfeldern des Telefons voraus, mit der Ausnahme von Texttelefonen (TTY), die ein visuelles Anzeigenfeld für die Rückmeldung haben.

Obwohl es für Gestalter von Benutzungsschnittstellen für Sprachdialogsysteme äußerst wichtig ist, die kulturellen und linguistischen Gesichtspunkte der Benutzungsschnittstelle zu berücksichtigen, die sich auf die vorgesehene Bevölkerungsgruppe auswirken, fallen diese Gesichtspunkte nicht mehr in den Anwendungsbereich dieser Norm. Ebenso wenig fallen detaillierte Festlegungen für die allgemeine Gestaltung von Benutzungsschnittstellen mit automatischer Spracherkennung (ASR, en: automatic speech recognition) in den Anwendungsbereich dieser Norm, da automatische Spracherkenner in verschiedenen Sprachen unterschiedlich funktionieren und die Technik sich weiter verbessert. Stattdessen befasst sich DIN EN ISO 9241-154 mit der Gestaltung der Benutzungsschnittstellen von Sprachdialogsystemen und nur mit den Bereichen der Gestaltung von ASR-Benutzungsschnittstellen, die sich auf die Dialoggestaltung auswirken. Viele gegenwärtige Sprachdialogsysteme stellen signifikante Zugangsschwierigkeiten für behinderte Menschen dar. Einige der Festlegungen in DIN EN ISO 9241-154 wurden insbesondere für Anrufer mit Behinderungen entwickelt, insbesondere gehörlose Menschen oder Menschen mit Hörschäden. DIN EN ISO 9241-154 gibt Leitsätze zur Gestaltung von IVR-Dialogen in sprachgesteuerten und auf Tonwahl beruhenden Sprachdialogsystemen. Deshalb liegt der Schwerpunkt dieser Norm auf der Schnittstelle zwischen Benutzer und IVR-Software sowie Datenbanken der Anwendung, die von Hardware und Software vermittelt wird, die Sprache und/oder Tonwahl erkennt und Sprachausgaben ermöglicht. Sowohl ASR-Systeme als auch DTMF-Erkennung bewirken Einschränkungen bei der Gestaltung von Sprachdialogen, und diese Einschränkungen wurden bei der Entwicklung der Leitsätze von DIN EN ISO 9241-154 berücksichtigt. Dennoch ist aus zwei Gründen nicht vorgesehen, dass DIN EN ISO 9241-154 sich der Gestaltung von ASR- oder DMTF-Benutzungsschnittstellen widmet. Erstens entwickelt sich die Technologie insbesondere für ASR-Systeme immer noch weiter und zweitens sind viele ASR-Benutzungsschnittstellen so gestaltet, dass sie eine visuelle Anzeige enthalten (zum Beispiel ASR-Diktatanwendungen), über die IVR-Anwendungen nicht verfügen. Zuletzt sind die meisten Leitsätze für sprachgesteuerte Dialoge zur Anwendung mit auf Grammatiken beruhenden Sprachdialogsystemen vorgesehen. Obwohl einige derselben Prinzipien für Systeme mit natürlichem Sprachverstehen gelten (NLU, en: natural language understanding, das heißt Anwendungen, die statistische Sprachmodelle verwenden), sind ausführliche Gestaltungsleitsätze für diese Anwendungen in dieser Norm nicht enthalten, da natürliche Spracherkennung mit einer anderen Technologie durchgeführt wird, und die Anwendung natürlicher Sprache in sprachgesteuerten Dialogsystemen sich noch in der Entwicklung befindet. Ebenso gibt es einige Gesichtspunkte der Anwendungsgestaltung, die für natürliche Sprachdialoge hinsichtlich der auf Grammatik beruhenden Sprachdialoge verschieden sind, zusätzlich zu den Unterschieden in der Dialoggestaltung, die sich besonders auf Spracherkennung beziehen. Es ist vorgesehen, dass die Festlegungen in diesem Dokument mit ISO/IEC 13714 "Information technology - Document processing and related communication - User interface to telephone-based services - Voice messaging applications" kompatibel sind, außer wenn anderweitig angegeben.

Für diese Norm ist das Gremium NA 023-00-04-05 GAK "Gemeinschaftsarbeitskreis NAErg/NIA: Benutzungsschnittstellen" im DIN zuständig.

Inhalt

Vorwort
Einleitung
1 Anwendungsbereich
2 Normative Verweisungen
3 Begriffe

  • Ansage
  • automatische Spracherkennung
  • Barge-In
  • Anrufer
  • Coaching
  • verknüpfte Eingabeaufforderungen
  • Konfidenzniveau
  • Konfidenzwert
  • kontinuierliche Spracherkennung
  • dialogorientierte Berichtigung
  • Löschungsfehler
  • Dial-Ahead-Funktion
  • Dial-Through-Funktion
  • digitalisierte Sprache
  • Hinweiswörter
  • diskrete Spracherkennung
  • Dualtonmultifrequenz
  • dynamische Grammatik
  • Endmarken
  • Training der Spracherkennung
  • explizite Bestätigung
  • Grammatik
  • implizite Bestätigung
  • Einfügungsfehler
  • interaktiver Sprachdialog
  • Orientierungspunkt
  • Mitteilung
  • gemischte Initiative
  • natürliches Sprachverstehen
  • offener Dialog
  • Persona
  • Priming
  • Eingabeaufforderung
  • Erkennungsfehler
  • aufgezeichnete Sprache
  • Zurückweisungsfehler
  • sprecherabhängig
  • Zustand
  • Verwechslungsfehler
  • synthetische Sprache
  • Systeminitiative
  • Talk-Ahead-Funktion
  • Talk-Through-Funktion
  • Texttelefon
  • Text/Sprache-Umwandlung
  • Zeitüberschreitung
  • Tuning
  • Sprecherwechsel
  • Stimmerkennung

4 Übereinstimmung
5 Anwendungen zur Anrufaufzeichnung (voice messaging)
6 Eingabe von Information

  • 6.1 Allgemeines
  • 6.2 Informieren von Texttelefon-Benutzern über mögliche Eingabearten
  • 6.3 Keine Vervielfältigung der Eingabe von Information
  • 6.4 Verwenden von Systeminformation zur Verbesserung der Leistungsfähigkeit
  • 6.5 Ändern von eingegebenen Informationen

7 Spracheingabe

  • 7.1 Wortschatzwahl für sprachgesteuerte IVR
  • 7.2 Phonetisch unterschiedlicher Wortschatz bei sprachgesteuerten IVR-Anwendungen
  • 7.3 Zustandspezifische Grammatik
  • 7.4 Synonyme in Grammatiken
  • 7.5 Verwendung dynamischer Grammatiken
  • 7.6 ASR-Training
    • 7.6.1 Allgemeines
    • 7.6.2 ASR-Training in der Benutzungsumgebung
    • 7.6.3 ASR-Training durch Wiederholen
  • 7.7 Endmarken setzen und Sprecherwechsel
  • 7.8 Handhabung von Zeitüberschreitungen bei Spracheingabe
  • 7.9 Sprach-IVR mit Tonwahl

8 Tonwahleingabe

  • 8.1 Anzeigen der Tonwahlfähigkeit
  • 8.2 Tastenbelegung für Begrenzungszeichen
  • 8.3 Die Rautetaste („#“) bei Dateneingaben mit festgelegter Länge
  • 8.4 Handhabung von Zeitüberschreitungen für Tonwahleingabe unterschiedlicher Länge
  • 8.5 Tastenbelegung für positive und negative Antworten
  • 8.6 Tastenbelegung für die „Hilfe“-Funktion
  • 8.7 Minimieren von Anrufer-Tastendrücken

9 Ausgabe von Information

  • 9.1 Allgemeine Festlegungen für Eingabeaufforderungen und Ansagen
    • 9.1.1 Kürze der Information
    • 9.1.2 Gruppieren von Information
    • 9.1.3 Betonung und andere Aspekte der Satzmelodie
    • 9.1.4 Sprechgeschwindigkeit
    • 9.1.5 Einfache linguistische Formen
    • 9.1.6 Vernünftige Anwendung höflicher Sprache bei Eingabeaufforderungen
    • 9.1.7 Beenden des Anrufs
    • 9.1.8 Akustische Qualität von Eingabeaufforderungen und Ansagen
    • 9.1.9 Akustisch einheitliche Lautstärke von Eingabeaufforderungen und Ansagen
    • 9.1.10 Anruferwahrnehmung des IVR als Computer
    • 9.1.11 Persona
    • 9.1.12 Wiederholung von Eingabeaufforderungen und Ansagen
    • 9.1.13 Wiederholung von Teilen langer Eingabeaufforderungen und Ansagen
    • 9.1.14 Eingabeaufforderungen und Ansagen für Benutzer von Texttelefonen
    • 9.1.15 Einheitlichkeit der Sprache
    • 9.1.16 Sprache von Texttelefonmeldungen (TTY)
  • 9.2 Konstruktion von Eingabeaufforderungen und Ansagen
    • 9.2.1 Sortieren von Einträgen in Optionslisten
    • 9.2.2 Sortieren von Tastenbelegungen für Optionslisten
    • 9.2.3 Sortieren von Zielen und Aktionen in Eingabeaufforderungen
    • 9.2.4 Betonung und andere Aspekte der Satzmelodie
    • 9.2.5 Betonung und andere Aspekte der Satzmelodie für verknüpfte Mitteilungen
    • 9.2.6 Betonung und andere Aspekte der Satzmelodie, um Sprecherwechsel zu erleichtern
    • 9.2.7 Einleitende Ausdrucksweise für Sprachoptionslisten
    • 9.2.8 Einschränkende Spracheingabe
    • 9.2.9 Verwendung von Hinweiswörtern und Orientierungspunkten
    • 9.2.10 Eindeutige Eingabeaufforderungen
    • 9.2.11 Unvollständige Gruppe von Optionen
    • 9.2.12 Zusätzliche Optionen
    • 9.2.13 Vermeiden expliziter Anweisungen über die Sprechweise
    • 9.2.14 In Eingabeaufforderungen verwendete Grammatik und Begriffe
    • 9.2.15 Irrelevante oder nicht verfügbare Optionen
    • 9.2.16 Tastenbelegung für nicht verfügbare/irrelevante Optionen
    • 9.2.17 Einheitlichkeit bei Tastenbelegungen
    • 9.2.18 Einheitlichkeit zwischen Sprach- und Tonwahloptionen

10 Navigation

  • 10.1 Weiterschaltfunktion
  • 10.2 Dial-Through-Funktion und Talk-Through-Funktion
  • 10.3 Dial-Ahead-Funktion und Talk-Ahead-Funktion
  • 10.4 Globale Kommandos
  • 10.5 Barge-In als Standardeinstellung
  • 10.6 Einschränken der Barge-In Funktion
  • 11 Hilfe
  • 11.1 Kontextabhängige Hilfe
  • 11.2 Vom Anrufer wählbare Hilfe
  • 11.3 Bezugnahme auf Hilfe in der ersten Eingabeaufforderung
  • 11.4 Hilfebefehle
  • 11.5 Vom System eingeleitete Hilfe

12 Zugang zu einem menschlichen Mitarbeiter

  • 12.1 Allgemeines
  • 12.2 Gleiche Voraussetzung zur Erreichbarkeit eines Mitarbeiters
  • 12.3 Hinweis auf Erreichbarkeit eines Mitarbeiters
  • 12.4 Einleiten der Verbindung mit einem Mitarbeiter
  • 12.5 Verzögerungen beim Erreichen eines Mitarbeiters
  • 12.6 Unterstützung durch einen Mitarbeiter
  • 12.7 Keine Hilfe eines Mitarbeiters verfügbar

13 Rückmeldung

  • 13.1 Allgemeines
  • 13.2 Rückmeldung auf Anrufereingabe
  • 13.3 Rückmeldung, die der Auswahl nicht verfügbarer Optionen folgt
  • 13.4 Reaktionszeit des Systems
  • 13.5 Geeigneter Kontext für Rückmeldungsmitteilungen
  • 13.6 Orientierungspunkte
  • 13.7 Bestätigungsdialoge
    • 13.7.1 Allgemeines
    • 13.7.2 Keine exzessive Bestätigung
    • 13.7.3 Bestätigung einfacher Worte und Sätze
    • 13.7.4 Explizite Eingabebestätigung zur Vermeidung nachteiliger Systemaktionen
    • 13.7.5 Bestätigung der Spracheingabe in Abhängigkeit von Konfidenzwerten
    • 13.7.6 Kombinieren von Bestätigungen
    • 13.7.7 Einleitungen für Bestätigungseingabeaufforderungen
    • 13.7.8 Wortwahl für Bestätigungseingabeaufforderungen und Ansagen
    • 13.7.9 Bestätigung von Ziffern- oder Zahlenfolgen
  • 13.8 Intelligente Verwendung abgelehnter Bestätigungsfragen
  • 13.9 Zusätzliche Rückmeldung in Verzögerungssituationen
  • 13.10 Handhabung ausgedehnter Wartezeiten
  • 13.11 Vorschlag, dass der Anrufer wieder anruft

14 Fehler

  • 14.1 Allgemeines
  • 14.2 Dienst nicht verfügbar
  • 14.3 Wiederholungen der Eingabeaufforderung
  • 14.4 Inhalt von Fehlermeldungen
  • 14.5 Zwei aufeinanderfolgende Eingabefehler bei Tonwahlgesteuerten IVR
  • 14.6 Zwei oder mehr aufeinanderfolgende Eingabefehler bei sprachgesteuerten IVR
  • 14.7 Handhabung von zahlreichen Fehlern
  • 14.8 Vermeiden abwertender Wortwahl in Fehlermeldungen
  • 14.9 Wichtige Mitteilungen
  • 14.10 Fehlerbehebung
  • 14.11 Unterbrechungsmitteilung
  • 14.12 Unterbrechen infolge Überschreiten der Fehlergrenze
  • 14.13 Hinweis auf Hilfe
  • 14.14 Wortwahl in Fehlermeldungen
  • 14.15 Hinweise über erwünschte Spracheingaben
  • 14.16 Beiläufige Fehlerkorrektur
  • 14.17 Handhabung von zu viel Spracheingabe
  • 14.18 Erwähnung von Tonwahloptionen bei Sprachgesteuerten IVR

Anhang A (informativ) Überblick über die Normenreihe ISO 9241

Anhang B (informativ) Die Rolle von Spracherkennungsfehlern bei der Gestaltung von IVR

B.1 Sprachgesteuerte IVR bringen Erkennungsfehler mit sich

B.2 Arten von Erkennungsfehlern und ihre Folgen

B.2.1 Allgemeines

B.2.2 Korrekte Zeitüberschreitung

B.2.3 Einfügungsfehler

B.2.4 Löschungsfehler

B.2.5 Verwechselungsfehler

B.2.6 Zurückweisungsfehler

B.2.7 Falsche Erkennung

B.2.8 Korrekte Zurückweisung

B.2.9 Häufigkeit der Fehlerarten

B.2.10 Gestaltung der Sprachbenutzungsschnittstelle für die Handhabung von Erkennungsfehlern

Literaturhinweise