John Coleman : « Mining a year of speech »

Introduction by OpenMethods Editor (Delphine Montoliu): This French report of John Coleman’s conference (podcast in English) explains the methodological stakes in the big corpora of oral data.

Si la question de l’exploitation de bases de données colossales demeure relativement « simple » à résoudre pour les bases de données écrites, elle soulève plusieurs enjeux majeurs et spécifiques en ce qui concerne les collections de corpus audio / oraux.

 

– En effet, comment donner la possibilité à un utilisateur de retrouver dans un grand corpus audio les extraits sonores qui l’intéressent ?

 

– Comment annoter ces corpus pour faciliter la recherche et la consultation de tels corpus ?

 

– et enfin, comment rendre disponibles et consultables ces bases de données très volumineuses ?

 

Original publication date: 01/06/2012

Source: John Coleman : « Mining a year of speech » – le document sonore