-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Persistenta identifierare för öppen programvara inom offentlig sektor #17
Comments
Myndigheterna borde definitivt identifieras med en identifierare. Tyvärr kan jag bara föreslå orgnummer, vet ej om det finns ett annat sätt. |
Lite teoretiskt vill jag att https://offentligkod.se/item/"https://gitlab.com/arbetsformedlingen/designsystem" borde ge utslag på om programvaran används eller inte. Men det kanske är mer än tjänst som är enkelt att bygga, och inte något som ska blandas ihop med identifieraren. |
@jonassodergren kolla med ESV hur dom tänker....
|
Skall man bli filosofisk så skulle vi vilja kunna se myndigheter över tid och ha relationer mellan olika länders myndigheter.... tror Datastory funderar lite på det med att versionshantera politiska processer i sin artikel "Fork me: The version-controlled political party" 5 star data Riksdagens Öppna data
|
Intressant. Jag är mer på en superkonkret nivå. https://www.bolagsverket.se/bolag/{orgnummer} borde finnas kan jag tycka. |
;-) du har ett jobb jag har en hobby som skall ge mig lite intellektuell stimulans på min ålders höst...
Exempel DIGG som borde ha en identifierare som finns med redan när den får sin instruktion i Riksdagens Öppna data
där borde Riksdagens öppna data ha
|
Identifiera myndighet
|
Katalogen har börjat att användas nu. Så nu är det fullt möjligt och lämpligt att börja tillhandahålla katalogen som ett dataset, flera organisationer verkar ha haft nytta utav den. Varje programvara kan definitivt identifieras med en unik URI. Det går att lösa, risken är att det blir att egenpåhittat nummer. Typ https://offentligkod.se/programvara/UUID eller dylikt. Tror inte standarden https://github.com/publiccodeyml/publiccode.yml/blob/main/docs/standard/example/publiccode.yml föreslår ett id-nummer per mjukvara. Ska rådfråga @Ainali som kanske har en idé. |
I kriteriet Make the codebase findable i Standard for Public Code föreslår vi antingen ett objekt i Wikidata, eller att skapa en post i FSF's Free Software Directory för att få ett ID. |
eller så är det en bra tillsvidare lösning eller tills vi lär oss mer...
@jonassodergren Känns spontant fel att inte ha unika identifierare har inte pip install massa möjligheter att ange dependencies och peka på det unika modul namnet |
Wikidata egenskap Property:P2537 |
Tack för bra återkoppling @Ainali och @salgo60. De flesta programvaror kommer vara sådana som används av offentlig sektor, om de programvarorna som används själva har ansökt eller inte är svårt att kontrollera. Just Python lider extremt mycket av https://en.wikipedia.org/wiki/Transitive_dependency där det ej går att styra tredjepart-bibliotek, och resultatet är programvaror som har tydliga versionsnummer där koden för samma version skiljer sig åt beroende på tid. Så jag glömmer din python-klommentar.. ;) |
Japp läser man länken i min post så sa dom ung, det.... steg 0 är nog bara att veta att man pratar om samma saker... att skapa en "Dependency Manager" är en annan nivå gissar jag.... 😃 En tanke som slår mig är att vi kanske borde ha dependency grapher mellan olika data set dvs. att dataset A på dataportalen fungerar med dataset B,C,D,E genom att vi har en gemensam termkatalog.... tycker WD mönstret med egenskaps namn som P + siffra e.g. P2537 är snyggt och sedan kunna visa det på flera språk ex. lista känns 2022... |
Ett API eller dylik teknik för att tillhandahålla data brukar oftast följa https://semver.org/. Har faktiskt reflekterat över att det inte finns en korrelation mellan mjukvarans version och datans/innehållets version. Någon borde ha tänkt på det. |
börjar du inte ha det när man kan ta hem hela Notebooks / eller container kits som Docker ?!?!? Har för mig att standard installationen av Jupyter så kan man köra ett exempel med en Nobelprisvinnare...... Gissar att vetenskapliga rapporter är mer noggranna... Steg 0: Är nog DOI för att peka unikt på dataseten gärna med version.... |
Exempelvis en docker-image med en version som stegas från 1.2.3 till 1.2.4 till 1.3.0 innehållande ett api kan ha oförändrad datamodell, eller så har flera nya informationsattribut tillkommit. Troligtvis har ej information tagits bort då det leder till att API:et ej är bakåtkompatibelt. Informellt hanteras versionen av datan oftast i dokumentation, men känner inte till en "best practice". Vetenskapliga artiklar är primärt bra på att ange referenser till data. |
@jonassodergren ny förkortning GUPRI Globally Unique, Persistent and Resolvable Identifier - video
cc: @dpriskorn tror FAIRDATA och FAIR-principles är ett bättre begrepp att trumma in än 5-stardata appropå ditt inlägg på portalen. Tror det även kan duga till att skapa en dashboard hur olika dataset uppfyller detta
|
Jag ringde ESV och frågade om beständiga identifierare på myndigheterna. Orgnummer görs av scb tydligen. |
Tills något talar för motsatsen tror jag att vi lugnt kan förutsätta att det är stabilt. |
Vi kan ju hanterar det i Wikidata precis som vi gör med kommunkoder som förändras för kommuner
|
Jag har börjat med poetry nyligen och den skapar en låsfil så jag kan garantera att jag testat på exakt samma biblioteksversioner som användaren får vid installation 😀 |
Tack, enig FAIR verkar bättre 😊 |
Håller med, FAIR-data är mer omfattande. @dpriskorn du kommer långt med en låsfil, men inte hela vägen. =) |
Jag vill bara notera att det är riskfyllt att marknadsföra FAIR-data som något önskvärt då de den tillåter alla möjliga slags licenser som till exempel för icke-kommersiell användning eller sådana som begränsar bearbetning (t.ex. CC BY-NC och CC BY-ND). Det vill säga, bara för att något uppfyller FAIR, så är det inte nödvändigtvis öppna data. Detta kan såklart vara mycket förvirrande varför jag föreslår att när man vill uppmuntra till publicering av öppna data, inte bör föreslå FAIR alls då det riskerar att få någon att helt missa målet trots att de uppfyllt kraven för det som man föreslagit. |
Ok @Ainali jag är nog i steg 1 ute efter att saker har identifierare och externa länkar så FAIRDATA är åt rätt håll till att ha bättre data och kanske få data leverantörerna att se vad som saknas.... status idag när vi tvekar på hur en myndighet identifieras efter 10 år med dataportalen känns galet... Min test med Nobeldata och att dom säger samma som Wikidata gör att vi vet på 5 sekunder vem som får årets Nobelpris så skall all data vara se #13 tänk om Riksdagens Öppna data och Kommunernas Anslagstavlor var designade med samma kvalitet på metadatan och med externa referenser dvs. 5 Star data Jag gillar Daniel Mietchens presentation 2017 hur snyggt Wikidata Wikibase uppfyller FAIRDATA Vid 8 min https://media.ccc.de/v/wikidatacon2017-10041-lightning_talk_session_4#t=468 |
Tack för påpekandet om detta. Jag tänker att om vi ber om FAIR data som även följer DIGGs rekommendationer om öppna data då kommer vi runt detta i de flesta fall. |
Ska man använda FAIR, så skulle jag säga att det endast är användbart för kvalitetskontroll av data som redan är öppen. Att försöka göra öppen data av oöppen FAIR data är mycket svårare. (Dvs. be om öppna data som följer DIGGs rekommendationer, samt även FAIR data principles snarare än i den andra ordningen.) |
@Ainali förklara gärna hur du tänker att rensa upp licens info känns för mig snabbt men kanske politiskt jobbigt... Att fixa dålig metadata kvalitet är att starta om från scratch igen och "tidigare jobb" är bortkastat.... Kollar vi på kultursektorn uppfattar jag att dom är mycket mera "mogna" då det gäller licens än kommuner och myndigheter Exempel
MEN den metadata som skickas är mest textsträngar trots att man i fallet Europeana har skickat data > 10 år - min blogpost
OT men frustrerande med KB att dom inte är tydliga med vad som görs, produktionssätts etc... vi vet inte om dom gjort något med licenser sedan dom svara 2019 nov
|
Även om du i teorin har rätt i att det kan ta 10 sekunder att byta licens så är min erfarenhet att det är en sorts myndighetsbeslut som en enskild tjänsteperson inte kan göra. Istället bollas det upp en nivå, jurister blandas in och beslut drar ut på tiden. Därför är det min åsikt att det är viktigare att få licensen rätt först så att man kan undvika att behöva städa i den frågan. För att alla de andra dataförbättringarna kan en enskild tjänsteperson eller projektgrupp bestämma att genomföra själva (förutsatt att det finns tid budgeterat). |
@Ainali tack. Jag tycker att
Min tro:
|
|
Uppdatering. (Ignorera fältnamn)
Just nu skapas id-numret (en MD5-hash) baserat på URI:en till mjukvaran som får anses unik. Känns ganska flexibelt. Leder till följande mönster för att identifiera en programvara: Tyck gärna till. |
@jonassodergren FYI @Ainali twittrade Tror ju fler externa identifierare du har desto bättre.... Tim Berners Lee säger att data is relations |
Jag har ett förbättringsförslag 😀 |
@dpriskorn hittade detta cc: @jonassodergren
|
Vad jag kan se så finns inget offentligt register utanför Wikidata med alla svenska myndigheter på ett ställe inklusive unika beständiga identifierare. |
Körde Open Refine och åtminstone en ny
|
Fondtorgsnämnden ny myndighet -->
Lesson learned:
|
Myndighetsregistret har varken API, SPARQL eller ändringsström heller så vi kan inte lätt samköra och säkerställa att datan är korrekt. |
@dpriskorn Och frågan är var man skall börja
Att sedan ha i ryggsäcken misslyckande som Rättsinformationssystemet som efter 15 år ger upp och misslyckas med att 100 myndigheter skall leverera några 1000 dokument, så borde man inse att en ny myndighet som verkar helt misslyckats med att jobba transparent inte blev bra Min troSamma passivitet som med museer ingen bryr sig och blir förbannad... vi behöver folk som tar fighten... säger jag till ESAM att deras digitala data länkar författningar vi inte kan hitta SKALL DOM REAGERA |
Fixade Wikipediaartikel. Citeq verkar saknas. 🤷♂️ |
@dpriskorn kollar du wikidata objektet för mallen Q22321052 så finns svWikipedia vet inte om alla funktioner finns
Tyvärr är svWikipedia gubbarna inte helt övertygade att saker skall citeras via WD
|
@gjonor uppdaterade NOSAD org.csv och jag reflekterade över fördelen att ha WIkibase istället för GITHUB fördelen om vi "tar steget över" till Wikibase är att då
GITHUB tycker jag har massa fördelar men jag tycker Wikibase med modellen att kunna ha motstridiga egenskaper och att kunna modulera saker som värdmyndighet se vad jag försöker göra med nya myndigheten Fondtorgsnämnden är det vi skall men jag ser inte att laguppställningen finns och ingen pratar om att skapa ett nytt ekosystem..... NOSAD är bra men lösa diskussioner löser inte saker...
|
Ja jag tänker i samma banor och funderar över metodiken för att överföra datan till Wikibase. |
Det tekniska tycker jag Wikidata visar på går att rel. enkelt går att göra av folk med olika bakgrund men var är laget som skall göra detta med myndighetsdata.... ?
Att hoppas på att detta ekosystem skall kunna leverera Länkade data där > 200 myndigheter och 290 kommuner utan ett fungerande ekosystem, utan publika backlogs, med massa misslyckande bakom sig skall skapa saker ihop är inte seriöst.... det är bara DIGG som har ett mantra att Sverige skall bli bäst
|
Har nu uppdaterat programvarukatalogen, https://offentligkod.se/, med ett enklare API https://offentligkod.se/api. API:et är i sin enklaste form, ska fixa till det de närmsta dagarna. Men vad sa vi om identifierare för myndigheter? Kom vi fram till att orgnummer är den enda lösningen? |
Publicerade sök-indexet också för den intresserade, https://offentligkod.se/index.json. |
Det är i dagsläget oklart eftersom SCB inte svarade på min fråga om de är beständiga över tid 🤷♂️ |
Önskar mig sameAs -> wikidata ->QID för alla poster. |
Bra. Kan ni hjälpa mig att hitta lämpliga QID för programvaror så lägger jag in sameAs? Om wikidata har lika informativa sidor som Q946976 ska jag överväga en "läs mer" funktion i gränssnittet som länkar till wikidata. |
Kanske en kandidat se länk
The text was updated successfully, but these errors were encountered: