There is a newer version of the record available.

Published July 7, 2021 | Version First release, constantly updated
Dataset Restricted

Lietuvos Respublikos Seimo debatų senogramų tekstynas nuo 1990 m. kovo mėn. 10 d. = Corpus of the Transcripts of the Debates of the Seimas of the Republic of Lithuania starting from March 10th, 1990

  • 1. Kaunas University of Technology
  • 2. Vytautas Magnus University

Description

Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo debatų stenogramos. Stenogramos parsiunčiamos automatizuotu būdu iš LR Seimo portalo ir/arba paieškos įrankių (abiejų sąrašų įrašai sutikrinami ir sudaromas bendras stenogramų sąrašas (su nuorodomis į šaltinius), kuris pridėtas prie šio duomenų rinkinio). Duomenų rinkinys apima stenogramas nuo 1990 m. kovo mėn. 10 d. iki paskutinės pilnos eilinės LR Seimo sesijos. Duomenų rinkinio atnaujinimas vykdomas pasibaigus paskutinei eilinei LR Seimo sesijai.

Stenogramos parsiunčiamos DOC/DOCX formatais ir transformuoamos į TXT bei CSV ir XLSX formatus:

1. Konvertavimas į TXT formatą vykdomas naudojant du įrankius: MultiDoc Converter (www.multidoc-converter.com/en/index.html) ir EmEditor (www.emeditor.com).

2. TXT formato stenogramos konvertuojamos į struktūruotus CSV ir XLSX failus naudojant R skriptus, kurie pridedami prie šio duomenų rinkinio.

3. Prie duomenų rinkinio pridėtas dokumentas, kuri aprašo CSV ir XLSX failų struktūrą.

Notes

Šio duomenų rinkinio duomenys ir jų aprašai (metaduomenys) yra licencijuojami pagal "Creative Commons" 4.0 priskyrimo ir analogiško platinimo tarptautinę viešąją licenciją (CC BY-SA 4.0). Data and their descriptions (metadata) in this dataset are licensed under the Creative Commons Attribution-ShareAlike 4.0 International licence (CC BY-SA 4.0).

Files

Restricted

The record is publicly accessible, but files are restricted to users with access.