Ergebnisse für *

Zeige Ergebnisse 1 bis 5 von 5.

  1. Computerlinguistische Datierung schriftsprachlicher chinesischer Texte
    Erschienen: 2022

    Die chronologische Einordnung von Texten ist für die Authentizitätsforschung und Exegese entscheidend. Für einige westliche Sprachen haben sich u. a. statistische Sprachmodelle (statistical language models, SLMs) als brauchbar erwiesen, mithilfe... mehr

    Zugang:
    Digitalisierung (kostenfrei)
    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Unter den Linden
    uneingeschränkte Fernleihe, Kopie und Ausleihe

     

    Die chronologische Einordnung von Texten ist für die Authentizitätsforschung und Exegese entscheidend. Für einige westliche Sprachen haben sich u. a. statistische Sprachmodelle (statistical language models, SLMs) als brauchbar erwiesen, mithilfe derer Texte einem chronon, d. h. einer Zeitspanne, zugeordnet werden. Ermöglicht wird das durch den grammatikalischen, phonologischen und lexikalischen Sprachwandel, sowie diachronen stilistischen Veränderungen. Die Datierung schriftsprachlicher chinesischer Quellen wird nicht nur durch Fälschungen, teils komplexe Überlieferungsgeschichten und unklare Urheberschaft erschwert. Bestimmte Textgattungen orientieren sich sprachlich zudem stark an antiken Vorbildern. Außerdem spiegeln sich die – durchaus vorhandenen – phonologischen Veränderungen in der chinesischen Schrift kaum wider. Diese Studie stellt sich dieser Problematik, indem sie die Anwendung neuer und etablierter computergestützter Methoden der Textdatierung untersucht und vergleicht. Ausgangspunkt ist die Geschichte der chinesischen Schriftsprache. Auf der Grundlage der offiziellen Dynastiegeschichten (zhengshi 正史) wird gezeigt, dass selbst innerhalb einer stilistisch homogenen Textreihe sowohl grammatikalische als auch lexikalische Veränderungen Hinweise auf die Entstehungszeit von Texten geben können. Wortneuschöpfungen, bedingt durch das Aufkommen neuer Begriffe und Konzepte, erweisen sich als Schlüsselindikator für den Zeitpunkt der Textgenese. Mit SLMs als Schwerpunkt wird der aktuelle Forschungsstand zu computergestützten und philologischen Verfahren der Textdatierung erläutert. Anschließend werden grundlegende Herausforderungen diskutiert: die Tokenisierung schriftsprachlicher chinesischer Texte, der Mangel an diachronen Korpora sowie die Erkennung von Namen (Named Entity Recognition, NER) und Zeitausdrücken (temporal expressions). Mit dem Ziel, lexikalische Veränderungen besser für die Datierung nutzbar zu machen, wird eine diachrone Lexemdatenbank des Chinesischen aufgebaut. Grundlage dafür bilden die Lexembelegstellen (loci classici) aus einer digitalen Version des Hanyu da cidian 漢語大詞典. Der Hauptteil ist der Entwicklung und Evaluation von computerlinguistischen Methoden für schriftsprachliche chinesische Texte gewidmet. SLMs werden für die Verwendung mit chinesischen n-Gramm und Plain Text Korpora angepasst. Neologismusprofile von Texten, die mithilfe der Lexemdatenbank erzeugt werden, werden als innovativer Ansatz eingeführt. Durch Berücksichtigung von datierten Personennamen und temporal expressions kann die Genauigkeit der Datierung noch erhöht werden. Um Zeit als kontinuierliche Variable behandeln zu können, wird auch das durchschnittliche Jahr der Lexikalisierung von Wörtern in einem gegebenen Text als experimenteller Datierungsindikator getestet. Es zeigt sich, dass SLMs erfolgreich für die chronologische Einordnung schriftsprachlicher chinesischer Texte eingesetzt werden können. Neologismusprofile erweisen sich jedoch als robuster gegenüber der stilistischen Rigidität der Schriftsprache, erfordern weniger spezifisches Training und lassen sich auch als Hilfestellung bei der philologischen Arbeit einsetzen. Alle drei evaluierten Methoden können mit dem im Rahmen dieser Studie entwickelten Online-Tool VisualTime getestet werden (https://visualtime.schalmey.de). The chronological classification of texts can be crucial for clarifying authenticity and interpretation. For several Western languages, statistical language models (SLMs), amongst other methods, have been proven useful for automatically assigning timespan (chronon) labels to texts. This is made possible by changes in style, grammar, vocabulary, and phonology. When it comes to Classical and Literary Chinese sources, dating can be complicated not only by the existence of forgeries, complex textual lineages, and obscure authorship, but also the fact that many genres attempted to remain faithful to ancient rhetorical and linguistic patterns. Additionally, major phonological changes are not often reflected in Chinese script. The present study assesses both new and established computational dating methods and examines related issues in computational processing of Literary Chinese. The history of the Chinese written language is the starting point for this study. On the basis of official dynastic histories (zhengshi 正史), it is shown that both grammatical and lexical changes can give clues to the time of production, even within a corpus of stylistically homogenous texts. Tied to the appearance of new concepts, lexical innovation is found to be a key indicator of the time of a text’s creation. Readers are then introduced to the current state of research on computational and philological methods of textual dating, emphasizing SLMs. The problems of Chinese word segmentation, the lack of diachronic Chinese corpora, as well as recognition of named entities and temporal expressions are discussed. A diachronic Chinese lexeme database for making lexical changes useful for dating is constructed from the earliest word use attestations (loci classici) sourced from a digital version of the Hanyu da cidian 漢語大詞典. The main part of the study is dedicated to the development, testing, and comparison of dating methods for Literary Chinese texts. SLMs are adapted to be used with Chinese n-gram and plain text corpora. Text neologism profiles, generated from the lexeme database, are introduced as an innovative approach to emphasize lexicalization in automated dating. Accuracy of dating is increased by the usage of dated proper names and temporal expressions. In an attempt to treat time as a continuous variable, the average year of lexicalization (AYL) of words in a given text is also tested as a dating indicator. It is found that SLMs can be successfully employed for assigning chronological categories to Literary Chinese texts. However, neologism profiles prove more robust against the rigidness of the written language, require less specific training, and can easily be combined with and aid the work of a philologist. Nevertheless, some Classical texts remain resistant to a linguistic analysis. All three evaluated methods can be tested through a ready-to-use online tool, VisualTime, developed by the author as part of this study (https://visualtime.schalmey.de).

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Staatsbibliothek zu Berlin
    Beteiligt: Soffel, Christian (AkademischeR BetreuerIn); Schöch, Christof (AkademischeR BetreuerIn)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Schriftsprachliches Chinesisch; Statistische Sprachmodelle; Hanyu da cidian 漢語大詞典; Wortschatzwandel; Dynastiegeschichten; zhengshi 正史; difangzhi 地方誌; CBDB; Tokenizer
    Umfang: 282 Seiten
  2. Sprache in der Coronakrise
    dynamischer Wandel in Lexikon und Kommunikation
  3. Areale Diversität und Sprachwandel im Dialektwortschatz
    Untersuchungen anhand des Sprachatlas der deutschen Schweiz
    Erschienen: [2017]
    Verlag:  Franz Steiner Verlag, Stuttgart

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Druck
    ISBN: 9783515116879; 3515116877
    Weitere Identifier:
    9783515116879
    Auflage/Ausgabe: [1. Auflage]
    Schriftenreihe: Zeitschrift für Dialektologie und Linguistik : [...], Beihefte ; Band 169
    Schlagworte: Schweizerdeutsch; Wortschatz; Sprachwandel; Sprachvariante; Sprachatlas
    Weitere Schlagworte: (Produktform)Paperback / softback; Wortschatzwandel; Sprachwandel; Onomasiologie; Dialektologie; Sprachgeographie; Schweizerdeutsch; Sprachatlas; Sprachvariation; Bezeichnungswandel; (VLB-WN)1563: Hardcover, Softcover / Sprachwissenschaft, Literaturwissenschaft/Deutsche Sprachwissenschaft, Deutschsprachige Literaturwissenschaft
    Umfang: 378 Seiten, Karten, 24 cm
  4. Sprache in der Coronakrise
    dynamischer Wandel in Lexikon und Kommunikation
    Beteiligt: Klosa-Kückelhaus, Annette (Herausgeber)
    Erschienen: [2021]
    Verlag:  IDS-Verlag, Mannheim

  5. Computerlinguistische Datierung schriftsprachlicher chinesischer Texte
    Erschienen: 2022

    Die chronologische Einordnung von Texten ist für die Authentizitätsforschung und Exegese entscheidend. Für einige westliche Sprachen haben sich u. a. statistische Sprachmodelle (statistical language models, SLMs) als brauchbar erwiesen, mithilfe... mehr

    Zugang:
    Digitalisierung (kostenfrei)
    Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, Haus Potsdamer Straße
    keine Fernleihe

     

    Die chronologische Einordnung von Texten ist für die Authentizitätsforschung und Exegese entscheidend. Für einige westliche Sprachen haben sich u. a. statistische Sprachmodelle (statistical language models, SLMs) als brauchbar erwiesen, mithilfe derer Texte einem chronon, d. h. einer Zeitspanne, zugeordnet werden. Ermöglicht wird das durch den grammatikalischen, phonologischen und lexikalischen Sprachwandel, sowie diachronen stilistischen Veränderungen. Die Datierung schriftsprachlicher chinesischer Quellen wird nicht nur durch Fälschungen, teils komplexe Überlieferungsgeschichten und unklare Urheberschaft erschwert. Bestimmte Textgattungen orientieren sich sprachlich zudem stark an antiken Vorbildern. Außerdem spiegeln sich die – durchaus vorhandenen – phonologischen Veränderungen in der chinesischen Schrift kaum wider. Diese Studie stellt sich dieser Problematik, indem sie die Anwendung neuer und etablierter computergestützter Methoden der Textdatierung untersucht und vergleicht. Ausgangspunkt ist die Geschichte der chinesischen Schriftsprache. Auf der Grundlage der offiziellen Dynastiegeschichten (zhengshi 正史) wird gezeigt, dass selbst innerhalb einer stilistisch homogenen Textreihe sowohl grammatikalische als auch lexikalische Veränderungen Hinweise auf die Entstehungszeit von Texten geben können. Wortneuschöpfungen, bedingt durch das Aufkommen neuer Begriffe und Konzepte, erweisen sich als Schlüsselindikator für den Zeitpunkt der Textgenese. Mit SLMs als Schwerpunkt wird der aktuelle Forschungsstand zu computergestützten und philologischen Verfahren der Textdatierung erläutert. Anschließend werden grundlegende Herausforderungen diskutiert: die Tokenisierung schriftsprachlicher chinesischer Texte, der Mangel an diachronen Korpora sowie die Erkennung von Namen (Named Entity Recognition, NER) und Zeitausdrücken (temporal expressions). Mit dem Ziel, lexikalische Veränderungen besser für die Datierung nutzbar zu machen, wird eine diachrone Lexemdatenbank des Chinesischen aufgebaut. Grundlage dafür bilden die Lexembelegstellen (loci classici) aus einer digitalen Version des Hanyu da cidian 漢語大詞典. Der Hauptteil ist der Entwicklung und Evaluation von computerlinguistischen Methoden für schriftsprachliche chinesische Texte gewidmet. SLMs werden für die Verwendung mit chinesischen n-Gramm und Plain Text Korpora angepasst. Neologismusprofile von Texten, die mithilfe der Lexemdatenbank erzeugt werden, werden als innovativer Ansatz eingeführt. Durch Berücksichtigung von datierten Personennamen und temporal expressions kann die Genauigkeit der Datierung noch erhöht werden. Um Zeit als kontinuierliche Variable behandeln zu können, wird auch das durchschnittliche Jahr der Lexikalisierung von Wörtern in einem gegebenen Text als experimenteller Datierungsindikator getestet. Es zeigt sich, dass SLMs erfolgreich für die chronologische Einordnung schriftsprachlicher chinesischer Texte eingesetzt werden können. Neologismusprofile erweisen sich jedoch als robuster gegenüber der stilistischen Rigidität der Schriftsprache, erfordern weniger spezifisches Training und lassen sich auch als Hilfestellung bei der philologischen Arbeit einsetzen. Alle drei evaluierten Methoden können mit dem im Rahmen dieser Studie entwickelten Online-Tool VisualTime getestet werden (https://visualtime.schalmey.de). The chronological classification of texts can be crucial for clarifying authenticity and interpretation. For several Western languages, statistical language models (SLMs), amongst other methods, have been proven useful for automatically assigning timespan (chronon) labels to texts. This is made possible by changes in style, grammar, vocabulary, and phonology. When it comes to Classical and Literary Chinese sources, dating can be complicated not only by the existence of forgeries, complex textual lineages, and obscure authorship, but also the fact that many genres attempted to remain faithful to ancient rhetorical and linguistic patterns. Additionally, major phonological changes are not often reflected in Chinese script. The present study assesses both new and established computational dating methods and examines related issues in computational processing of Literary Chinese. The history of the Chinese written language is the starting point for this study. On the basis of official dynastic histories (zhengshi 正史), it is shown that both grammatical and lexical changes can give clues to the time of production, even within a corpus of stylistically homogenous texts. Tied to the appearance of new concepts, lexical innovation is found to be a key indicator of the time of a text’s creation. Readers are then introduced to the current state of research on computational and philological methods of textual dating, emphasizing SLMs. The problems of Chinese word segmentation, the lack of diachronic Chinese corpora, as well as recognition of named entities and temporal expressions are discussed. A diachronic Chinese lexeme database for making lexical changes useful for dating is constructed from the earliest word use attestations (loci classici) sourced from a digital version of the Hanyu da cidian 漢語大詞典. The main part of the study is dedicated to the development, testing, and comparison of dating methods for Literary Chinese texts. SLMs are adapted to be used with Chinese n-gram and plain text corpora. Text neologism profiles, generated from the lexeme database, are introduced as an innovative approach to emphasize lexicalization in automated dating. Accuracy of dating is increased by the usage of dated proper names and temporal expressions. In an attempt to treat time as a continuous variable, the average year of lexicalization (AYL) of words in a given text is also tested as a dating indicator. It is found that SLMs can be successfully employed for assigning chronological categories to Literary Chinese texts. However, neologism profiles prove more robust against the rigidness of the written language, require less specific training, and can easily be combined with and aid the work of a philologist. Nevertheless, some Classical texts remain resistant to a linguistic analysis. All three evaluated methods can be tested through a ready-to-use online tool, VisualTime, developed by the author as part of this study (https://visualtime.schalmey.de).

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: Staatsbibliothek zu Berlin
    Beteiligt: Soffel, Christian (AkademischeR BetreuerIn); Schöch, Christof (AkademischeR BetreuerIn)
    Sprache: Deutsch
    Medientyp: Buch (Monographie)
    Format: Online
    Weitere Identifier:
    Schlagworte: Schriftsprachliches Chinesisch; Statistische Sprachmodelle; Hanyu da cidian 漢語大詞典; Wortschatzwandel; Dynastiegeschichten; zhengshi 正史; difangzhi 地方誌; CBDB; Tokenizer
    Umfang: 282 Seiten