N-grams et identification des auteurs

https://openmethods.dariah.eu/2017/09/18/n-grams-et-identification-des-auteurs-sacre-grl/ OpenMethods introduction to: N-grams et identification des auteurs 2017-09-18 13:29:49 Introduction: This post presents a number code for authorship identification. Delphine Montoliu http://graal.hypotheses.org/417 Blog post Analysis Capture Cluster Analysis Code Concordancing Creation Data Data Recognition Encoding Enrichment French Give Overview Interpretation Language Meta-Activities Methods Named Entities Named Entity Recognition Pattern Recognition POS-Tagging Programming Research Activities Research Objects Research Process Research Techniques Sequence Alignment Stilistic Analysis Text Transcription Web development via bookmarklet

Introduction by OpenMethods Editor (Delphine Montoliu): This post presents a number code for authorship identification.

Ces derniers temps, les études dans le domaine de l’authorship attribution ou de la classification des textes ont pris un souffle nouveau par le biais de l’utilisation de n-grams, ouvrant des perspectives nouvelles pour la création de modèles indépendants de la langue du texte, de modèles ne nécessitant pas de preprocessing, d’encodage syntaxique, ou de connaissances a priori sur le style des auteurs, avec des taux de réussite souvent relativement élevés. Cette tendance nouvelle mérite quelque peu d’attention et d’explication.

 

Original publication date: 27/07/2011.

Source: N-grams et identification des auteurs | Sacré Gr@@l