{ "access": { "embargo": { "active": false, "reason": null }, "files": "public", "record": "public", "status": "open" }, "created": "2021-07-13T12:41:11.912393+00:00", "custom_fields": {}, "deletion_status": { "is_deleted": false, "status": "P" }, "files": { "count": 2, "enabled": true, "entries": { "datasetCOVID.csv": { "checksum": "md5:d59d29a63ee65ba7a4dc62b01cf88383", "ext": "csv", "id": "a6f51945-ce0d-4274-b84a-4591430348c5", "key": "datasetCOVID.csv", "metadata": null, "mimetype": "text/csv", "size": 73753903 }, "notice_datasetCOVID.pdf": { "checksum": "md5:3204d653d2417b9ad3fdbd45b10a5541", "ext": "pdf", "id": "980c23c6-c4f8-46f7-8987-62027b80fd3f", "key": "notice_datasetCOVID.pdf", "metadata": null, "mimetype": "application/pdf", "size": 265479 } }, "order": [], "total_bytes": 74019382 }, "id": "5094969", "is_draft": false, "is_published": true, "links": { "access": "https://zenodo.org/api/records/5094969/access", "access_links": "https://zenodo.org/api/records/5094969/access/links", "access_request": "https://zenodo.org/api/records/5094969/access/request", "access_users": "https://zenodo.org/api/records/5094969/access/users", "archive": "https://zenodo.org/api/records/5094969/files-archive", "archive_media": "https://zenodo.org/api/records/5094969/media-files-archive", "communities": "https://zenodo.org/api/records/5094969/communities", "communities-suggestions": "https://zenodo.org/api/records/5094969/communities-suggestions", "doi": "https://doi.org/10.5281/zenodo.5094969", "draft": "https://zenodo.org/api/records/5094969/draft", "files": "https://zenodo.org/api/records/5094969/files", "latest": "https://zenodo.org/api/records/5094969/versions/latest", "latest_html": "https://zenodo.org/records/5094969/latest", "media_files": "https://zenodo.org/api/records/5094969/media-files", "parent": "https://zenodo.org/api/records/5094968", "parent_doi": "https://zenodo.org/doi/10.5281/zenodo.5094968", "parent_html": "https://zenodo.org/records/5094968", "requests": "https://zenodo.org/api/records/5094969/requests", "reserve_doi": "https://zenodo.org/api/records/5094969/draft/pids/doi", "self": "https://zenodo.org/api/records/5094969", "self_doi": "https://zenodo.org/doi/10.5281/zenodo.5094969", "self_html": "https://zenodo.org/records/5094969", "self_iiif_manifest": "https://zenodo.org/api/iiif/record:5094969/manifest", "self_iiif_sequence": "https://zenodo.org/api/iiif/record:5094969/sequence/default", "versions": "https://zenodo.org/api/records/5094969/versions" }, "media_files": { "count": 0, "enabled": false, "entries": {}, "order": [], "total_bytes": 0 }, "metadata": { "additional_descriptions": [ { "description": "Projet MESCOV financ\u00e9 par le Comit\u00e9 analyse, recherche et expertise (CARE) du Minist\u00e8re de l'Education Sup\u00e9rieure, de la Recherche et de l'Innovation.", "type": { "id": "notes", "title": { "de": "Anmerkungen", "en": "Notes" } } } ], "creators": [ { "affiliations": [ { "name": "IMT Mines Albi" } ], "person_or_org": { "family_name": "Aur\u00e9lie Montarnal", "name": "Aur\u00e9lie Montarnal", "type": "personal" } }, { "affiliations": [ { "name": "IMT Mines Albi" } ], "person_or_org": { "family_name": "Julien Coche", "name": "Julien Coche", "type": "personal" } }, { "affiliations": [ { "name": "Telecom Paris" } ], "person_or_org": { "family_name": "Sandrine Bubendorff", "name": "Sandrine Bubendorff", "type": "personal" } }, { "affiliations": [ { "name": "IMT Mines Albi" } ], "person_or_org": { "family_name": "Nathan Thubert", "name": "Nathan Thubert", "type": "personal" } }, { "affiliations": [ { "name": "IMT Mines Albi" } ], "person_or_org": { "family_name": "Marie-Lys Camozzi", "name": "Marie-Lys Camozzi", "type": "personal" } }, { "affiliations": [ { "name": "Telecom Paris" } ], "person_or_org": { "family_name": "Caroline Rizza", "name": "Caroline Rizza", "type": "personal" } } ], "description": "
Contexte
\n\nCe dataset est mis à disposition dans le cadre du projet MESCOV « les media sociaux lors de la crise Covid-19 » financé par le Comité analyse, recherche et expertise (CARE) du Ministère de l’Education Supérieure, de la Recherche et de l’Innovation. Le projet MESCOV traite des aspects création et circulation de l’information sur les media sociaux lors de la crise COVID-19, des initiatives citoyennes qui y ont émergé et des pratiques des professionnels de la gestion de crise associées (notamment Service d’Incendie et de Secours et Préfecture).
\n\nC’est un projet pluridisciplinaire qui mobilise à la fois les Sciences de l’Informatique et de la Donnée pour le module base de données et algorithme d’apprentissage automatique et les Sciences Humaines et Sociales pour la partie documentation des mécanismes de création, de circulation et de vérification de l’information sur les media sociaux, l’émergence d’initiatives citoyennes et l’utilisation des médias sociaux par les institutionnels (Camozzi, et al., 2020, à paraître).
\n\nAcquisition des données et constitution du jeu de tweets
\n\nCe jeu de tweets a été généré à partir du dataset proposé par Banda et al. (2020) récolté en temps-réel. Ce dataset a été constitué à partir des mots-clés suivants : COVD19, CoronavirusPandemic, COVID-19, 2019nCoV, CoronaOutbreak,coronavirus , WuhanVirus, covid19, coronaviruspandemic, covid-19, 2019ncov, coronaoutbreak, wuhanvirus.
\n\nLes tweets utilisés sont ceux publiés entre le 22 mars et le 24 juin 2020.
\n\nLe jeu de données que nous proposons a été hydraté en utilisant l’outil Twarc, et seuls les tweets en langue française ont été conservés. Il comprend 2.950.157 tweets au 15 juillet 2020, date de sa création.
\n\nConditions d’utilisation et citation du set de tweets
\n\nSi vous citez ou réutilisez ce dataset merci de mentionner Montarnal, A., Coche, J., Bubendorff, S. Thubert, N., Camozzi, M-L., & Rizza, C. (2020) « Set de tweets francophones relatif à la crise de covid-19 à des fins de recherche ».
\n\nCe jeu de tweets a été créé sur la base légale de l’intérêt public. Il est fourni tel quel, suivant les
\n\nrèglements de Twitter. Seuls les identifiants des tweets sont fournis au format csv. L’hydratation du dataset est possible, par exemple en utilisant le projet Python Twarc (https://github.com/DocNow/twarc).
\n\nIl ne contient pas de données personnelles mais en réhydratant ce dataset, les chercheurs pourront retrouver les auteurs des tweets à partir de l’ID du tweet associé. Ce jeu de tweets ne peut être utilisé qu’à des fins non-commerciales et de recherche. Les chercheurs seront responsables de leur traitement.
\n\nRéférences
\n\nBanda J-M., et al., “A large-scale COVID-19 Twitter chatter dataset for open scientific research -- an international collaboration,” arXiv:2004.03688 [cs], Nov. 2020, Accessed: Nov. 24, 2020. [Online]. Available: http://arxiv.org/abs/2004.03688.
\n\nCamozzi M-L., Thubert N., Coche J., Bubendorff S., Montarnal A., & Rizza C. (2020) Les media sociaux lors de la crise sanitaire de Covid-19 : Circulation de l'information et initiatives citoyennes. i3 Working Papers Series, 16-SES-01
", "languages": [ { "id": "fra", "title": { "en": "French" } } ], "publication_date": "2021-07-13", "publisher": "Zenodo", "resource_type": { "id": "dataset", "title": { "de": "Datensatz", "en": "Dataset" } }, "rights": [ { "description": { "en": "The Creative Commons Attribution license allows re-distribution and re-use of a licensed work on the condition that the creator is appropriately credited." }, "icon": "cc-by-icon", "id": "cc-by-4.0", "props": { "scheme": "spdx", "url": "https://creativecommons.org/licenses/by/4.0/legalcode" }, "title": { "en": "Creative Commons Attribution 4.0 International" } } ], "subjects": [ { "subject": "covid19" }, { "subject": "covid" }, { "subject": "tweets" }, { "subject": "twitter" }, { "subject": "pandemic" }, { "subject": "french" } ], "title": "SET DE TWEETS FRANCOPHONES RELATIF A LA CRISE DE COVID-19 A DES FINS DE RECHERCHE" }, "parent": { "access": { "owned_by": { "user": 161428 } }, "communities": {}, "id": "5094968", "pids": { "doi": { "client": "datacite", "identifier": "10.5281/zenodo.5094968", "provider": "datacite" } } }, "pids": { "doi": { "client": "datacite", "identifier": "10.5281/zenodo.5094969", "provider": "datacite" }, "oai": { "identifier": "oai:zenodo.org:5094969", "provider": "oai" } }, "revision_id": 3, "stats": { "all_versions": { "data_volume": 4069473136.0, "downloads": 104, "unique_downloads": 70, "unique_views": 276, "views": 341 }, "this_version": { "data_volume": 3995188275.0, "downloads": 101, "unique_downloads": 69, "unique_views": 275, "views": 339 } }, "status": "published", "updated": "2021-07-13T13:48:21.665851+00:00", "versions": { "index": 1, "is_latest": true } }