Skip to content
Snippets Groups Projects
Commit 69ed2606 authored by Adrien Klose's avatar Adrien Klose
Browse files

add information on the harry db and umls

parent 9eff252d
No related branches found
No related tags found
No related merge requests found
Based on https://www.ncbi.nlm.nih.gov/books/NBK9684/
CUI - Concept Unique Identifier - identifiziert ein Konzept/Bedeutung
SUI - String Unique Identifier - Name/String eines Konzeptes, kann mehrdeutig sein
AUI - Atom Unique Identifier - jedes String vorkommen in einem Quellvokabular gekennzeichnet
LUI - Lexical Unique Identifier - für Englisch werden SUI und AUI auf einen Stamm abgebildet
ISPREF - bestimmt ob der String der bevorzugte Bezeichner für das Konzept ist
REL - allgemeine Beschreibung der Beziehung/Relation
RELA - genauere Beschreibung der Beziehung, existiert nur bei ca. 1/4 der Beziehungen
select count(*) from mrrel where rela is not null ---> 24501078
select count(*) from mrrel where rela="" ---> 8650546
RUI - Relationship Unique Identifier - Identifiziert eine Relation eindeutig
If same Relationship Group (RG) and AUI2 it is a relationship group but the meaning?
ATUI - Attribut Unique Identifier - gibt theoretisch Konzept/Atom/Relations Attribute aber anscheinend nicht hier bis auf die DEF/Definitionen?; verfeinern Informationen
Für spezifische Informationen über die Spalten der einzelnen Tabellen und Beispiele betrachte:
https://www.ncbi.nlm.nih.gov/books/NBK9685/
MRREL - https://www.ncbi.nlm.nih.gov/books/NBK9685/table/ch03.T.related_concepts_file_mrrel_rrf/?report=objectonly
- 24.501.078 Relationship Einträge
- RELA hat 609 verschiedene Einträge, 1024 RELA Einträgen auf https://www.nlm.nih.gov/research/umls/knowledge_sources/metathesaurus/release/abbreviations.html (noch unbekannt wie sich diese überschneiden)
- gibt gerichtete und ungerichtete Beziehungen
MRCONSO - https://www.ncbi.nlm.nih.gov/books/NBK9685/table/ch03.T.concept_names_and_sources_file_mr/?report=objectonly
- 7.524.723 Einträge/AUIs, 6.620.347 SUIs, 5.974.963 LUIs, 3.605.283 CUIs
- enthält nur Englische Begriffe
- alle Einträge sind Lizenz Kategorie 0 und somit keine weiteren Einschränkungen als Allgemeine
- SAB enthält 96 einzigartige Einträge, 187 Quellvokabularen auf https://www.nlm.nih.gov/research/umls/sourcereleasedocs/index.html; enthält Einträge die nicht in der Online Liste zu finden sind in der Form NCI_xxxx ; ansonsten alle Kategorie 0 ENG enthalten außer NCISEER
MRSTY - https://www.ncbi.nlm.nih.gov/books/NBK9685/ unter 3.3.7
- 3.900.667 Einträge
MRDEF - https://www.ncbi.nlm.nih.gov/books/NBK9685/table/ch03.T.definitions_file_mrdef_rrf/?report=objectonly
- 301.237 Einträge
- kann teilweise bis zu 3000 Zeichen lang werden
......@@ -7,11 +7,24 @@
- ?
- BioASQ
- ?
- Datenbank von Harry umls.db
- ?
- Database that's highly likely a unidentified subsets of UMLS
- If subset of UMLS its use would be forbidden by the license agreement
- Our interpretation is based on UMLS description
- Examples and more information in harry_umls.txt
- UMLS
- Collection of files and software about health and biomedical vocabularies
- Subsets should be easily creatable with MetamorphoSys
- Current release on https://www.nlm.nih.gov/research/umls/licensedcontent/umlsknowledgesources.html
- List for abbrevations https://www.nlm.nih.gov/research/umls/knowledge_sources/metathesaurus/release/abbreviations.html
- Unsure about the license agreement although Germany should be a member country
- Concept Name Indexes should help with retrieval
## Usefull
- https://obofoundry.org/
- Collection of multiple ontologies
- Information to each ontology is in obo_foundry
## Useless
\ No newline at end of file
## Useless
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment