Caractéristiques linguistiques des titres de publications scientifiques

Journal de recherche

Sommaire

  1. Objectifs
  2. Lectures
  3. Données
  4. Interrogation de HAL
  5. Liens
Dernière mise à jour le 23 octobre 2017. HAL compte 1 409 684 éléments.

Objectifs

Objectifs du semestre 1

  • Choix du mémoire avant le 16 octobre 2017
  • Dépôt du sujet de mémoire avant le 27 octobre 2017
  • Rédaction d’un état de l’art dans le domaine de recherche retenu
  • Capacité à bien expliquer la problématique de recherche
  • Première présentation des données de l’étude
  • Potentialités de l’étudiant évaluées au cours du semestre (motivation, autonomie, rigueur, assiduité, progression)

Livrable : document de 15 à 20 pages (simple interligne, times 11 ou équivalent, recto-verso N&B, pages numérotées) au plus tard le lundi 22 janvier 2017. Le document doit obligatoirement comprendre une bibliographie correctement formatée.

Lectures

  1. (en cours) Lewison, Grant & Hartley, James (2005). What’s in a title? Number of words and the presence of colons. Scientometrics. 63. 341-356. 10.1007/s11192-005-0216-0
  2. (à voir) Haggan, M. (2004). Research paper titles in literature, linguistics and science: dimensions of attraction. Journal of Pragmatics, 2.36: 293-317.

Données

Échantillons

Échantillon du 20 octobre 2017

  • 146 602 titres
  • 53 169 ( 36.27 %) titres avec un deux-points ':'

Les titres par leur discipline majeur

#Champ (code)Approximation champ en texteNombre%
1.SHSSciences de l'Homme et Société10067868.670%
2.SDVSciences du Vivant [q-bio]1480710.100%
3.INFOInformatique [cs]83125.670%
4.SPISciences de l'ingénieur [physics]78055.320%
5.SDESciences de l'environnement35282.410%
6.PHYSPhysique [physics]32832.240%
7.SDUPlanète et Univers [physics]19881.360%
8.MATHMathématiques [math]19701.340%
9.CHIMChimie14901.020%
10.SCCOSciences cognitives12650.860%
11.N???6520.440%
12.QFINÉconomie et finance quantitative [q-fin]3560.240%
13.P???2490.170%
14.STATStatistiques [stat]1700.120%
15.NLINScience non linéaire [physics]150.010%
16.NAMathématiques [math]/Analyse numérique [math.NA]
OU
Informatique [cs]/Analyse numérique [cs.NA]
100.010%
17.M???90.010%
18.NEP???20.000%
19.B???20.000%
20.ARC???10.000%
21.H???10.000%
22.D???10.000%
23.PNEU???10.000%
24.ITInformatique [cs]/Théorie de l'information [cs.IT]10.000%
25.S???10.000%
26.EMIM???10.000%
27.C???10.000%
28.CDVM???10.000%
29.CEINTURE???10.000%
30.U???10.000%

Interrogation de HAL

Paramètres

  • Sortie : wt=json ou xml
  • Indentation : indent=true
  • Champs voulus : fl= (séparés par une virgule)

Champs OK

  • domain_s
  • authFullName_s
  • title_s
  • docType_s
  • modifiedDateY_i
  • rows (défaut : 30, max : 10 000)

Exemples de requêtes

Une requête sur une chercheuse :

https://api.archives-ouvertes.fr/search/?q=lenorzer&wt=json&fl=domain_s,authFullName_s,docType_s,title_s,modifiedDateY_i&indent=true

Avoir tous les dommaines avec label, docid et code (max 10000 résultats) au format JSON :

https://api.archives-ouvertes.fr/ref/domain?wt=json&indent=true&rows=10000&fl=label_s,docid,code_s

Avoir des infos sur le domaine "sdv" au format JSON :

https://api.archives-ouvertes.fr/ref/domain?q=sdv&wt=json&indent=true
Damien Gouteux 2017-2018