Caractéristiques linguistiques des titres de publications scientifiques
Journal de recherche
Sommaire
Dernière mise à jour le 23 octobre 2017. HAL compte 1 409 684 éléments.Objectifs
Objectifs du semestre 1
- Choix du mémoire avant le 16 octobre 2017
- Dépôt du sujet de mémoire avant le 27 octobre 2017
- Rédaction d’un état de l’art dans le domaine de recherche retenu
- Capacité à bien expliquer la problématique de recherche
- Première présentation des données de l’étude
- Potentialités de l’étudiant évaluées au cours du semestre (motivation, autonomie, rigueur, assiduité, progression)
Livrable : document de 15 à 20 pages (simple interligne, times 11 ou équivalent, recto-verso N&B, pages numérotées) au plus tard le lundi 22 janvier 2017. Le document doit obligatoirement comprendre une bibliographie correctement formatée.
Lectures
- (en cours) Lewison, Grant & Hartley, James (2005). What’s in a title? Number of words and the presence of colons. Scientometrics. 63. 341-356. 10.1007/s11192-005-0216-0
- (à voir) Haggan, M. (2004). Research paper titles in literature, linguistics and science: dimensions of attraction. Journal of Pragmatics, 2.36: 293-317.
Données
Échantillons
Échantillon du 20 octobre 2017
- 146 602 titres
- 53 169 ( 36.27 %) titres avec un deux-points ':'
Les titres par leur discipline majeur
| # | Champ (code) | Approximation champ en texte | Nombre | % |
|---|---|---|---|---|
| 1. | SHS | Sciences de l'Homme et Société | 100678 | 68.670% |
| 2. | SDV | Sciences du Vivant [q-bio] | 14807 | 10.100% |
| 3. | INFO | Informatique [cs] | 8312 | 5.670% |
| 4. | SPI | Sciences de l'ingénieur [physics] | 7805 | 5.320% |
| 5. | SDE | Sciences de l'environnement | 3528 | 2.410% |
| 6. | PHYS | Physique [physics] | 3283 | 2.240% |
| 7. | SDU | Planète et Univers [physics] | 1988 | 1.360% |
| 8. | MATH | Mathématiques [math] | 1970 | 1.340% |
| 9. | CHIM | Chimie | 1490 | 1.020% |
| 10. | SCCO | Sciences cognitives | 1265 | 0.860% |
| 11. | N | ??? | 652 | 0.440% |
| 12. | QFIN | Économie et finance quantitative [q-fin] | 356 | 0.240% |
| 13. | P | ??? | 249 | 0.170% |
| 14. | STAT | Statistiques [stat] | 170 | 0.120% |
| 15. | NLIN | Science non linéaire [physics] | 15 | 0.010% |
| 16. | NA | Mathématiques [math]/Analyse numérique [math.NA] OU Informatique [cs]/Analyse numérique [cs.NA] | 10 | 0.010% |
| 17. | M | ??? | 9 | 0.010% |
| 18. | NEP | ??? | 2 | 0.000% |
| 19. | B | ??? | 2 | 0.000% |
| 20. | ARC | ??? | 1 | 0.000% |
| 21. | H | ??? | 1 | 0.000% |
| 22. | D | ??? | 1 | 0.000% |
| 23. | PNEU | ??? | 1 | 0.000% |
| 24. | IT | Informatique [cs]/Théorie de l'information [cs.IT] | 1 | 0.000% |
| 25. | S | ??? | 1 | 0.000% |
| 26. | EMIM | ??? | 1 | 0.000% |
| 27. | C | ??? | 1 | 0.000% |
| 28. | CDVM | ??? | 1 | 0.000% |
| 29. | CEINTURE | ??? | 1 | 0.000% |
| 30. | U | ??? | 1 | 0.000% |
Interrogation de HAL
Paramètres
- Sortie : wt=json ou xml
- Indentation : indent=true
- Champs voulus : fl= (séparés par une virgule)
Champs OK
- domain_s
- authFullName_s
- title_s
- docType_s
- modifiedDateY_i
- rows (défaut : 30, max : 10 000)
Exemples de requêtes
Une requête sur une chercheuse :
https://api.archives-ouvertes.fr/search/?q=lenorzer&wt=json&fl=domain_s,authFullName_s,docType_s,title_s,modifiedDateY_i&indent=true
Avoir tous les dommaines avec label, docid et code (max 10000 résultats) au format JSON :
https://api.archives-ouvertes.fr/ref/domain?wt=json&indent=true&rows=10000&fl=label_s,docid,code_s
Avoir des infos sur le domaine "sdv" au format JSON :
https://api.archives-ouvertes.fr/ref/domain?q=sdv&wt=json&indent=true