Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Feedback dataset organisationer #23

Closed
salgo60 opened this issue Jun 27, 2024 · 7 comments
Closed

Feedback dataset organisationer #23

salgo60 opened this issue Jun 27, 2024 · 7 comments

Comments

@salgo60
Copy link

salgo60 commented Jun 27, 2024

Jag efterlyser backlogs med metadataskuld om vi skall röra oss framåt issue #24

Exempel på lesson learned som borde delas så fler vet utmaningen Vi testade att köra openrefine för 6 månaders sedan och försökte matcha Riksarkivets dataset med Wikidata endast

perrohdin/Bildhistoria-Masterdata-och-Wikidata#10 (comment)


Det är mycket "gegga" som scoutkårer och det är lite för lite bra info hos Riksarkivet

  1. jag körde Open Refine automatch
image
  1. sedan gick igenom 800 stycken för hand och kolla när flera alternativ var föreslagna

  2. tar du exempel Torpshamra så finns det massa Torpshamra i Wikidata men ofta är det orter, museer som gar artikel....

image
  1. att modulera organisationer över tid dvs. koncern / vilka namn byten som sker och vilka som köps upp kan vara svårt och tror wikipedia folk mer leker med influencers och adel gubbar....

Lesson learned

att koppla "samma som" är även för enkla saker som personer/bolag kostsamt.

@salgo60
Copy link
Author

salgo60 commented Jun 27, 2024

Bra att dela men FB skalar inte utan använd Wikidata eller bygg ett eget WD

image

Vi ser på Wikidata att Sveriges kulturarv är mycket klippa klistra mellan olika datasilos och ser inte heller att källor används på ett proffsigt maskinläsbart sätt dvs. enormt svårt att förstå trovärdighet hos presenterat data #167 Provenance i maskinläsbar form

@salgo60
Copy link
Author

salgo60 commented Jun 27, 2024

exempel där tydlighet vad som skall levereras gör att vi slipper dubbelarbete

image

Projekt Runeberg

Min tanke ett Riksarkiv som delar sina planer gör även att Runeberg springer åt rätt håll idag blir det bara datasilos

Skall kulturarvet ta steget till bra metadata och länkade data så behövs att alla begrepp som används kopplas ihop...

Min lösning skrev jag ned 2020 i "The Magnus list"

image

@Abbe98
Copy link

Abbe98 commented Jun 27, 2024

@salgo60 ditt spam här gör det bara svårare för oss som faktiskt vill följa, använda och förbättra Riksarkivets dataplattform.

@salgo60
Copy link
Author

salgo60 commented Jun 27, 2024

@Abbe98 Förklara hur vi får fart på kulturarvet känns som inga ställer frågor till Riksarkivet och Riksarkivet stänger allt... så det är inte så mycket att följa... alla får pengar skattepengar men inga verkar jobba ihop...

Så länge man inte jobbar ingenjörsmässigt så kommer dom inte framåt är min tro....

Den produkt som Riksarkivet levererar verkar inte ens forskarna vilja ha utan väljer data från en hobbysite som Wikidata se SWERIKS

@Abbe98
Copy link

Abbe98 commented Jun 27, 2024

@salgo60 snack snack. Sluta fylla mina notifikationer med strunt.

@salgo60
Copy link
Author

salgo60 commented Jun 27, 2024

@Abbe98 berätta gärna vad du gjort hos Riksarkivet så vi andra förstår vart dom är på väg...


Problemet jag belyser med Riksarkivets data om organisationer är att

  • folk vill ha bra data ex. Bildhistoria
  • det snackas en hel del att man kan köra Open Refine och tvätta data... här funkar inte det med Wikidata för att där finns inte bra organisations data historiskt
  • att skall data bli bra så tvätta det vid källan vi kan inte gissa...

Nu skrivs det lite på FB om olika saker men det blir bara rörigt det måste till backloggar och en vilja att leverera bra data... LLM behöver data med bra kvalitet...

@DavidHaskiya
Copy link

Detta är en issue-board för Riksarkivets APIer. Inte för öppna dataset eller allmänt tyckande. Issuen stängs.

@Riksarkivet Riksarkivet locked as off-topic and limited conversation to collaborators Jun 27, 2024
Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants