Caractéristiques linguistiques des titres de publications scientifiques
Journal de recherche
Sommaire
Dernière mise à jour le 23 octobre 2017. HAL compte 1 409 684 éléments.Objectifs
Objectifs du semestre 1
- Choix du mémoire avant le 16 octobre 2017
- Dépôt du sujet de mémoire avant le 27 octobre 2017
- Rédaction d’un état de l’art dans le domaine de recherche retenu
- Capacité à bien expliquer la problématique de recherche
- Première présentation des données de l’étude
- Potentialités de l’étudiant évaluées au cours du semestre (motivation, autonomie, rigueur, assiduité, progression)
Livrable : document de 15 à 20 pages (simple interligne, times 11 ou équivalent, recto-verso N&B, pages numérotées) au plus tard le lundi 22 janvier 2017. Le document doit obligatoirement comprendre une bibliographie correctement formatée.
Lectures
- (en cours) Lewison, Grant & Hartley, James (2005). What’s in a title? Number of words and the presence of colons. Scientometrics. 63. 341-356. 10.1007/s11192-005-0216-0
- (à voir) Haggan, M. (2004). Research paper titles in literature, linguistics and science: dimensions of attraction. Journal of Pragmatics, 2.36: 293-317.
Données
Échantillons
Échantillon du 20 octobre 2017
- 146 602 titres
- 53 169 ( 36.27 %) titres avec un deux-points ':'
Les titres par leur discipline majeur
# | Champ (code) | Approximation champ en texte | Nombre | % |
---|---|---|---|---|
1. | SHS | Sciences de l'Homme et Société | 100678 | 68.670% |
2. | SDV | Sciences du Vivant [q-bio] | 14807 | 10.100% |
3. | INFO | Informatique [cs] | 8312 | 5.670% |
4. | SPI | Sciences de l'ingénieur [physics] | 7805 | 5.320% |
5. | SDE | Sciences de l'environnement | 3528 | 2.410% |
6. | PHYS | Physique [physics] | 3283 | 2.240% |
7. | SDU | Planète et Univers [physics] | 1988 | 1.360% |
8. | MATH | Mathématiques [math] | 1970 | 1.340% |
9. | CHIM | Chimie | 1490 | 1.020% |
10. | SCCO | Sciences cognitives | 1265 | 0.860% |
11. | N | ??? | 652 | 0.440% |
12. | QFIN | Économie et finance quantitative [q-fin] | 356 | 0.240% |
13. | P | ??? | 249 | 0.170% |
14. | STAT | Statistiques [stat] | 170 | 0.120% |
15. | NLIN | Science non linéaire [physics] | 15 | 0.010% |
16. | NA | Mathématiques [math]/Analyse numérique [math.NA] OU Informatique [cs]/Analyse numérique [cs.NA] | 10 | 0.010% |
17. | M | ??? | 9 | 0.010% |
18. | NEP | ??? | 2 | 0.000% |
19. | B | ??? | 2 | 0.000% |
20. | ARC | ??? | 1 | 0.000% |
21. | H | ??? | 1 | 0.000% |
22. | D | ??? | 1 | 0.000% |
23. | PNEU | ??? | 1 | 0.000% |
24. | IT | Informatique [cs]/Théorie de l'information [cs.IT] | 1 | 0.000% |
25. | S | ??? | 1 | 0.000% |
26. | EMIM | ??? | 1 | 0.000% |
27. | C | ??? | 1 | 0.000% |
28. | CDVM | ??? | 1 | 0.000% |
29. | CEINTURE | ??? | 1 | 0.000% |
30. | U | ??? | 1 | 0.000% |
Interrogation de HAL
Paramètres
- Sortie : wt=json ou xml
- Indentation : indent=true
- Champs voulus : fl= (séparés par une virgule)
Champs OK
- domain_s
- authFullName_s
- title_s
- docType_s
- modifiedDateY_i
- rows (défaut : 30, max : 10 000)
Exemples de requêtes
Une requête sur une chercheuse :
https://api.archives-ouvertes.fr/search/?q=lenorzer&wt=json&fl=domain_s,authFullName_s,docType_s,title_s,modifiedDateY_i&indent=true
Avoir tous les dommaines avec label, docid et code (max 10000 résultats) au format JSON :
https://api.archives-ouvertes.fr/ref/domain?wt=json&indent=true&rows=10000&fl=label_s,docid,code_s
Avoir des infos sur le domaine "sdv" au format JSON :
https://api.archives-ouvertes.fr/ref/domain?q=sdv&wt=json&indent=true