Separation
Facebook Youtube Twitter
Separation
Separation

Corpus de textes en ligne

Collections de textes littéraires, philosophiques, de sources historiques (compilées à partir d’éditions imprimées préexistantes ou par exploitation de fonds d’archives).

Dans ces ressources, les publications ayant servi de sources pour la publication en ligne perdent leur individualité, les textes sont reformatés pour se présenter sous la forme d’un ensemble de corpus de textes littéraires.

Les corpus linguistiques sont des collections de textes préparés pour permettre des analyses lexicographiques ou linguistiques. Ils ne permettent pas d’accéder au texte complet, en règle générale, uniquement au contexte des occurrences recherchées.

Textes français (littérature et langue)

Grand corpus des littératures française et francophone (Moyen Âge - 20e siècle) - Classiques Garnier numérique

Corpus de référence de la littérature française et francophone, constitué de la réunion de quatre sous-corpus spécialisés gérés par un même logiciel, qui permet d’effectuer des requêtes complexes sur tout ou partie des textes.

Les œuvres retenues sont éditées en ligne à partir des meilleures éditions. L’ensemble représente un corpus représentatif de la littérature française et francophone (plus de 14 000 textes, 300 auteurs en œuvres complètes).

À utiliser en complément, deux autres corpus, l’un littéraire, l’autre linguistique :

  • Écrits sur l’art 1741-1927 (Garnier)
    Corpus spécialisé de la critique d’art française, précisément des salons et monographies littéraires consacrés à des peintres par des écrivains et des critiques importants (Diderot, Stendhal, Baudelaire, Goncourt, Huysmans, Zola, Apollinaire, Planche, Thoré, Champfleury, Mirbeau, etc.), de 1741 (Essai sur le beau du père André) à 1927 (M. Proust).
    Volumétrie : 169 titres de 72 auteurs
  • Frantext (ATILF/CNRS)
    Corpus de textes français compilé à l’origine pour servir de base à l’édition du Trésor de la langue française dans les années 1970. Plus de 4 000 textes, datés de 1180 à 2009, essentiellement littéraires et philosophiques, mais comprenant une part de textes scientifiques et techniques.
    Objectif du corpus : constituer un échantillon représentatif permettant des études portant sur l’évolution de la langue française. Pas d’accès aux œuvres elles-mêmes : on utilise la ressource pour établir des listes d’occurrences contextualisées de formes lexicales ou grammaticales (possibilité très large de recherche sur les lemmes ou par expression régulière ; fonctionnalité de calcul de fréquence d’occurrence). Une partie des textes a été catégorisée pour permettre des recherches sur des types d’expression (expression de la date, de la quantification, etc.).
    Aide-mémoire de la syntaxe de recherche (fichier pdf)

TLG (Thesaurus linguae graecae)

Corpus de textes grecs, visant à l’exhaustivité pour les périodes antique et byzantine, extension en projet vers la période moderne.

Volumétrie : approx. 10 000 œuvres de 4 000 auteurs. Les éditions sont reprises de publications imprimées, vérifiez la source des textes mis en ligne (il ne s’agit pas toujours des plus récentes ni des meilleures éditions).

Attention ! La licence d’utilisation du TLG ne vous donne pas le droit de décharger les textes, seule la consultation en ligne est autorisée. Merci de respecter cette règle, au risque d’une interruption de l’abonnement par l’éditeur.

Le corpus a été lemmatisé en 2006. Une nouvelle édition du dictionnaire Liddell-Scott-Jones a été mise en ligne par le TLG en 2011. Par ailleurs, le site est associé par de multiples renvois au site Perseus pour l’accès à des traductions des textes en anglais.

Textes latins

Corpus de textes latins de l’éditeur Brepols, comprenant deux corpus généraux et des ensembles complémentaires plus spécialisés, gérés sur la même plate-forme (formulaire de recherche croisée).

Il s’agit plus de concordances que de corpus de textes conçus dans une perspective littéraire. Le maniement du logiciel nécessite la consultation des modes d’emploi de chaque ressource.

  • Library of latin texts A
    Corpus de textes latins et néo-latins (extension du projet Cetedoc library of christian latin texts, originellement restreint aux périodes patristique et médiévale). Comprend en particulier :
    - corpus entier de la littérature latine jusqu’au 2e s. (source principale : Bibliotheca scriptorium Romanorum Teubneriana),
    - auteurs non chrétiens des 3e-8e s.,
    - Vulgate et pseudépigraphes de l’Ancien testament,
    - corpus des décrets des conciles,
    - Decretum de Gratien,
    - traductions latines anciennes, médiévales ou modernes de philosophes et de pères de l’Église (Aristote, Platon, Origène, Porphyre, Avicenne, etc.),
    - textes hagiographiques,
    - textes de la patristique et de la scolastique médiévale (source principale : Corpus Christianorum, Series latina & Continuatio medievalis),
    - littérature néo-latine (moins de 5% du corpus).
    Env. 3200 textes, 950 auteurs. Éditions revues par le Centre Traditio litterarum occidentalium (CTLO).
    Mode d’emploi (fichier pdf)
  • Library of latin texts B
    Corpus de textes latins et néo-latins, en cours de développement. Complément de la série A, avec des procédures d’édition simplifiées (reprise d’éditions préexistantes), mais les mêmes fonctionnalités de recherche. Grande diversité générique (corpus des grammairiens, hagiographie, chroniques, textes juridiques, traités philosophiques, théologiques et scientifiques, récits de voyage, ...). Accès à terme à tous les textes de la Bibliotheca Teubneriana Latina. En particulier, auteurs de la Renaissance italienne et allemande (Celse, Valla, Reuchlin, etc.) et auteurs latins d’Europe orientale.
    Mode d’emploi (fichier pdf)
  • Archive of Celtic-Latin literature
    Corpus des textes latins produits dans les régions de langue celtique (Îles Britanniques, Bretagne). Env. 450 textes (2008). Actualisation en cours.
    Mode d’emploi (fichier pdf)
  • Aristoteles latinus
    Corpus des traductions latines médiévales d’Aristote.
    Mode d’emploi (fichier pdf)
  • Monumenta Germaniae historica
    Sources de l’histoire médiévale de l’Allemagne (publ. imprimée 1826-). Numérisation en cours. Mêmes fonctionnalités de recherche que dans la Library of latin texts.
    Mode d’emploi (fichier pdf)
    Autre version, plus complète : accès libre (fac-similés et module de recherche) sur le site de la Bayerische Staatsbibliothek, dMGH

Textes anglais

Deux corpus très larges et un corpus spécialisé sur l’œuvre de Shakespeare :

  • EEBO - Early English Books Online
    Corpus visant à l’exhaustivité du patrimoine documentaire imprimé britannique du 15e au 17e s.
    Fac-similés de plus de 125 000 ouvrages publiés entre 1471 et 1700 en Angleterre, Écosse, Pays de Galles, Irlande, Amérique du Nord anglophone, et en langue anglaise ailleurs.
    La numérisation a été réalisée à partir de microfiches, sur la base des deux éditions du Short Title Catalog et en complétant avec la Thomason Tracts Collection.
    Voir les détails sur la page d’information.
    Une partie du contenu est en cours de transcription pour permettre la recherche sur le texte intégral.
  • LION - Literature Online
    Corpus de la littérature de langue anglaise (prose, poésie, théâtre), des premiers textes au début du 20e siècle, auquel sont ajoutés des outils bibliographiques (Annual bibliography of English language and literature 1920-, MLA international bibliography 1926-), des usuels (dictionnaires, dictionnaires encyclopédiques, Companion guides en littérature de l’éditeur Cambridge university press, biographies, bibliographies d’auteurs, etc.) et des revues (350 titres de revues).
    Abonnement à deux séries complémentaires : Twentieth Century Drama, African Writers Series.
    Voir le détail du contenu auquel les bibliothèques de Paris-Sorbonne sont abonnées.
  • Shakespeare collection
    Éd. Arden des œuvres de Shakespeare, fac-similés (29 quartos publ. 1597-1634, autres éditions historiques), prompt books, usuels (incl. Encyclopedia of the Renaissance (2000, 6 vol., Scribner)), la série Shakespearean criticism (118 vol., Gale), Gordon Crosse Diaries, biographies de contemporains de Shakespeare, illustrations, quelques dizaines de titres de revues, etc.

Textes allemands

  • Digitale Bibliothek deutscher Klassiker
    Édition en ligne d’ouvrages de la collection Deutscher Klassiker Verlag (Suhrkamp), fondée en 1981.
    Corpus d’auteurs allemands (dont auteurs médiévaux et Renaissance, ETA Hoffmann, Hölderlin, Herder, Kleist, Lessing, etc.) et collections de textes historiques et politiques (discours, documents sur la Guerre de sept ans, la Révolution française, l’histoire de l’Église, la Staatslehre, etc.), philosophiques (Fichte, Kritik der Urteilskraft de Kant), de critique artistique et d’histoire de l’art.
    La collection en ligne n’est pas actualisée, il manque quelques volumes, ainsi que la totalité des œuvres de Goethe et de Schiller
    Site Web de la collection
  • Goethes Werke
    Texte intégral de la Weimarer Ausgabe en 143 vol. (1887-1919, reprint 1987), complété par trois volumes de correspondance édités par P. Raabe en 1990 et une édition ancienne de propos de Goethe, Goethes Gespräche (éd. Woldemar Freiherr von Biedermann, Leipzig, 1889-96)
  • Schillers Werke
    Texte intégral des volumes de la Nationalausgabe parus entre 1943 et 1996.
    La base n’est pas actualisée (voir l’état actuel de l’édition)
  • Der literarische Expressionismus Online : Zeitschriften, Jahrbücher, Sammelwerke, Anthologien
    Corpus des publications du mouvement expressioniste en Allemagne (env. 1910-1925) : revues littéraires, anthologies, recueils d’essais. Fac-similés. Nombreuses notices bio-bibliographiques. La base n’est pas actualisée
    Liste complète des publications
  • Deutsche Literatur des 18. Jahrhunderts Online
    Fac-similés en ligne des premières éditions et des premières publications d’œuvres complètes de plus de 640 auteurs de langue allemande du 18e siècle, soit env. 3 000 œuvres et 1 million de pages numérisées. Comprend aussi des œuvres de théorie de la littérature (Gottsched, Nicolai, Lessing, Mendelssohn) et philosophiques (Kant). La base n’est pas actualisée.
    Basé, avec des compléments, sur l’édition sur microfiches Bibliothek der deutschen Literatur, qui couvre la période 1650-1900
  • Die Deutsche Lyrik in Reclams Universalbibliothek
    Œuvres poétiques publiées dans la collection Reclams Universalbibliothek depuis 1945 (env. 500 auteurs du 15e au début du 20e s.). Pas d’actualisation

Textes espagnols

  • Teatro español del Siglo de Oro
    Anthologie très large du théâtre espagnol des 16e et 17e siècles (plus de 800 pièces de 16 auteurs, dont Lope de Vega, Calderón de la Barca, Agustín Moreto). Transcription complète, comprenant les parties liminaires (privilèges, dédicaces, etc.), établie à partir de premières éditions

Autres ressources en accès réservé

Textes grecs

  • New Jacoby Online
    Édition révisée des textes grecs des Fragmente der griechischen Historiker (1re éd. 1923-1959) de Felix Jacoby, avec traduction en anglais, ajout de textes et de commentaires, notices bio-bibliographiques. Actualisé en parallèle avec la publication des compléments (parties IV et V, etc.)
  • Patrologia Graeca
    Texte intégral en fac-similé de la Patrologiae cursus completus. Series graeca édité en 161 vol. par Jacques-Paul Migne (1re éd. 1857-1866) : œuvres des Pères de l’Église et des auteurs chrétiens écrivant en langue grecque jusqu’à la chute de Byzance ("A S. Barnaba ad Bessarionem"). Textes grecs et traduction latine en regard. Avec les index : Index Locupletissimus de Theodore Hopfner, Paris, 1928, 1936 ; Indices de Ferdinand Cavallera, Paris, 1912 ; Graeci indices de D. Scolarios, 1879-1887

Histoire de l’Allemagne

  • Nationalsozialismus, Widerstand, Holocaust und Exil 1933-1945
    Sources (archives, discours, journaux intimes, etc.) et instruments de référence (dictionnaires biographiques, guides de fonds d’archives, organigrammes, listes d’abréviations, etc.), en texte intégral (env. 40 000 documents).
    Provenance : archives des hautes autorités du régime nazi, en particulier de la chancellerie du NSDAP ; rapports des organes de sécurité ; discours, écrits et ordres d’A. Hitler 1925-1945 ; journaux de Goebbels 1923-1945 ; inculpations et jugements du Volksgerichtshof et des hautes cours de justice de Vienne et de Graz ; documents de l’opposition au régime nazi (brochures, tracts, discours, écrits) ; inventaires des biens des exilés et des déportés ; archives du tribunal de Nuremberg

Corpus

  • Dictionary of Old English - Old English Corpus
    Corpus de travail pour l’édition du Dictionary of Old English (état de la langue au Haut MoyenAge, 600-1150). Comprend au moins un exemplaire de tous les textes existants (manuscrits, inscriptions)

Littérature grise

  • Eric
    Accès à plus de 320 000 documents en sciences de l’éducation (1966-) : rapports, communications en congrès, thèses et mémoires, etc., indexés par l’Education resources information center (États-Unis).
    Il existe un accès ouvert à cette ressource sur le site de l’ERIC.

Actualités

  • Nouvelle ressource:
    Film Indexes Online
    Ressources de la Fédération internationale des archives du film (FIAF) (dont la bibliographie International index to film periodicals (1972-)),
    filmographie de l'American film institute (AFI Catalog, 1893-1971),
    filmographie du British film institute (Film index international, 1900-).
    Accès au texte complet des articles d'une cinquantaine de revues dépouillées dans la bibliographie de la FIAF
  • Nouvelle ressource:
    HAPI Online
    Bibliographie des études latino-américaines (1970-)
  • L'accès à distance au portail des universités parisiennes du Monde (archives du Monde et du Monde diplomatique) a été mis en place
  • Nouvelle plate-forme:
    les ressources encyclopédiques de l'éditeur Brill ont été transférées sur une nouvelle plate-forme
  • Nouvelle ressource:
    Cambridge Histories Online
    300 vol. de la collection Cambridge histories (Cambridge University Press)
  • Nouvelle ressource:
    Early English Books Online
    Numérisation de la presque intégralité du patrimoine imprimé au Royaume-Uni et en Amérique du Nord anglophone, ainsi que des ouvrages en langue anglaise imprimés ailleurs, de 1471 à 1700.
    Fac-similés numérisés en mode image. Une partie des textes (env. 20 %) est accessible en mode texte
  • Nouvelle ressource:
    accès au Monde et au Monde diplomatique à partir du portail des universités, avec le soutien de l'université numérique Paris-Île-de-France et de la Ville de Paris.
    Accès à partir du réseau de l'université uniquement, des accès à distance seront mis en place ultérieurement.
    www.lemonde.fr/portail-des-universites
  • Nouvelle ressource:
    les archives de revues savantes de la collection Arts & Sciences VIII de JSTOR

Accès direct vers les ressources les plus utilisées

Contacts

Pour tout problème concernant les ressources en ligne ou pour toute suggestion sur le fonctionnement de ce service, vous pouvez contacter

Dominique Filippi, responsable des collections électroniques