Was ist OpenAlex – und wie kann man es für die Recherche nutzen?

In diesem Beitrag erhältst du eine kompakte Einführung in OpenAlex: Was steckt hinter der Datenbank, welche Inhalte bietet sie und wie kannst du sie sinnvoll für deine Recherche nutzen? Der Beitrag ist in folgende Abschnitte unterteilt:

1. Was ist OpenAlex?

OpenAlex ist eine frei zugängliche bibliografische Datenbank für wissenschaftliche Literatur und Informationen. Der Name ist eine Anspielung auf die bekannte antike Bibliothek von Alexandria, die als ein Symbol für Wissen und Zugang zu Informationen gilt. OpenAlex enthält Metadaten zu wissenschaftlichen Publikationen, Zeitschriften, Autor*innen und Institutionen. Der Dienst wird seit dem 03. Januar 2022 offen zugänglich von der Non-Profit-Organisation OurResearch angeboten. Letztere ist unter anderem auch durch das Browser-Plugin Unpaywall bekannt. Unpaywall zeigt mithilfe eines grünen Schlosses an, ob ein wissenschaftlicher Artikel hinter einer Paywall in einer frei verfügbaren Open-Access-Version angeboten wird (siehe auch Open-Access-Recherche-Webseite der TUB).

Für viele Hochschulen und Forschungseinrichtungen sind hohe Lizenzkosten kommerzieller Datenbanken wie Scopus und Web of Science (siehe auch Blogbeitrag Mehr aus Web of Science rausholen) eine wiederkehrende Herausforderung, wie unter anderem auch eine Umfrage zu diesem Thema an der TUHH zeigt. OpenAlex bietet hier eine kostenfreie, transparente Alternative – ganz im Sinne von Open Science und Open Data.

2. Welche Inhalte bietet OpenAlex?

Eine Vielzahl an Informationen in OpenAlex stammt aus dem Microsoft Academic Graph (MAG), einer umfassenden, strukturierten Datenbank zu wissenschaftlichen Publikationen, Autor*innen, Institutionen und deren Verbindungen. MAG wurde Ende des Jahres 2021 eingestellt. Die darin enthaltenen Daten wurden erfreulicherweise offen zugänglich gemacht. Die Einstellung von MAG verdeutlicht, dass wissenschaftliche Infrastruktur und Inhalte nicht ausschließlich von kommerziellen Anbietern abhängig sein sollten, denn deren Dienste können jederzeit eingestellt oder verändert werden. Mit MAG konnten Forschungsergebnisse durchsucht, analysiert und visualisiert werden – OpenAlex führt diesen Gedanken offen und frei zugänglich weiter.

Zu den weiteren zentralen Datenquellen von OpenAlex gehört Crossref – eine Organisation, die für wissenschaftliche Publikationen sogenannte DOIs (Digital Object Identifiers) vergibt. Diese sorgen für eine eindeutige, dauerhafte Zitierbarkeit und Auffindbarkeit von Veröffentlichungen im Internet.

OpenAlex greift darüber hinaus auf weitere Quellen zurück, die auch von der TUB unterstützt oder empfohlen werden:

Darüber hinaus bezieht OpenAlex Informationen aus verschiedenen Repositorien, was die inhaltliche Tiefe und Vielfalt der enthaltenen wissenschaftlichen Informationen weiter erhöht. Eine vollständige Übersicht aller Datenquellen findet sich in der offiziellen OpenAlex-Dokumentation.

3. So funktioniert die OpenAlex-Weboberfläche

OpenAlex sammelt vertrauenswürdige Daten aus verschiedenen Quellen und macht diese über unterschiedliche Zugangswege zugänglich. Nachfolgend werfen wir einen Blick auf das Web-Interface, welches seit September 2022 zur Verfügung steht und kontinuierlich weiterentwickelt wird. Nach Aufruf von https://openalex.org erscheint zunächst eine einfache Suchmaske.

3.1 Erste Schritte: Recherche in OpenAlex

Als Beispiel geben wir „renewable energy“ in das Suchfeld ein. Schon beim Tippen erscheinen konkrete Titelvorschläge sowie die Option, „in work title & abstract“ zu suchen. Wir wählen diese, um eine thematische Suche zu starten, die Publikationen einschließt, deren Titel, Abstract oder (falls verfügbar) Volltext den Begriff enthalten.

Die Trefferliste erscheint auf der linken Seite des Fensters und ist standardmäßig nach Relevanz sortiert. Dieser sogenannte „Relevance Score“ basiert unter anderem auf Textähnlichkeit und Zitierungen (siehe OpenAlex-Dokumentation im Abschnitt „Relevance Score“). Die Sortierung lässt sich mit einem Klick auf „sort by“ aber auch auf Optionen wie „citation count“, „citation percentile“, „title“ oder „year“ abändern, was man in ähnlicher Form von anderen Datenbanken kennt.

Auf der rechten Seite der Trefferliste finden wir interaktive Filter zur Verfeinerung der Suche, etwa nach Publikationstyp, Jahr oder Open Access. Über das „+“-Symbol im rechten Teil des Fensters lassen sich weitere Filter wie „language“, „corresponding authors“, „continent“ oder auch „from Global South“ hinzufügen. Hier wird unter anderem auch ein weiterer Unterschied von OpenAlex zu anderen Datenbanken, die sich oftmals auf den englischen Sprachraum fokussieren, deutlich.

Für unseren Suchbegriff „renewable energy“ fügen wir an dieser Stelle exemplarisch die Filter „author“ (Klick auf „+“ > „author“) und „Continent“ (Klick auf „+“ > „More“ > „Continent“) hinzu. Es fällt auf: „Frede Blaabjerg“ erscheint als besonders produktiver Autor. Wir möchten uns diese Person nun im Rahmen unserer Recherche etwas genauer über einen Klick auf den Personennamen anschauen. In der Autor*innenansicht sehen wir, dass sich die angezeigten Zahlen und Filter dynamisch anpassen. Zu sehen sind unter anderem:

  • 345 Treffer,
  • 47 % der Publikationen in Open Access publiziert.

Wählen wir nun zusätzlich den Open-Access-Filter durch einen Klick aus, reduziert sich die Trefferliste auf 162.

Jetzt wählen wir die am häufigsten zitierte Publikation aus: „Overview of Control and Grid Synchronization for Distributed Power Generation Systems“. Sie erscheint ganz oben, wenn über die Sortierung („sort by“) die Option „citation count“ gewählt wurde. Die Detailansicht zeigt Metadaten und verschiedene Zugangsmöglichkeiten zum Dokument an. So können wir zum Beispiel die HTML-Version des Artikels öffnen (Klick auf „HTML“) oder direkt das PDF des Dokuments (Klick auf „PDF“) aufrufen.

Mit einem Klick auf den Autorennamen öffnet sich eine Übersichtsseite zur Person mit aggregierten Informationen und erneut verfügbaren Filtern. Mit diesen lassen sich Publikationsprofile individuell untersuchen.

3.2 Institutional Search

Neben der thematischen Recherche bietet OpenAlex auch die Möglichkeit zur institutionellen Suche. Dazu starten wir erneut über die Suchleiste auf der Startseite von OpenAlex, diesmal mit dem Ziel, die Technische Universität Hamburg (TUHH) zu finden. Sobald wir „Hamburg University of Technology“ eintippen, erscheinen bereits mehr oder weniger passende Vorschläge. Wir wählen die gewünschte Institution aus.

Anschließend sehen wir unter anderem, dass aktuell 17.740 Publikationen mit der TUHH verknüpft sind. In der rechten Spalte ist sichtbar, das es sich bei den meisten Treffern um Artikel handelt (13.510), gefolgt von Buchkapiteln (2.992) und Preprints (429).

Nun verfeinern wir die Suche: Wir fügen den Filter „authors“ hinzu und wählen das Vorjahr (2024) in der Filterkategorie „year“ aus. So erhalten wir einen Überblick über die TUHH-Publikationen des vergangenen Jahres. Hier sehen wir: Forschende aus Bereichen wie „Medical Technology and Intelligent Systems“, „Geo-Hydroinformatics“, „High-Frequency Technology“, „Climate Protecting Energy- and Environmental Engineering“ and „Technical Education and Higher Education Didactics“ hatten ein produktives Jahr 2024. Zudem wurden über 61 % der Publikationen Open Access veröffentlicht.

Anstelle eines einzelnen Jahres lassen sich auch Zeiträume wie „2020-2025“ filtern. Dafür klicken wir bei den Suchfeldern am oberen Bildschirmrand, die auch für Verfeinerung oder Erweiterung von aktiven Rechercheanfragen genutzt werden können, auf das blau hinterlegte „+“, wählen den Filter „year“ und geben den gewünschten Zeitraum ein. Diese Funktion ist hilfreich, um Publikationstrends über mehrere Jahre hinweg zu analysieren.

4. Datenzugriff über API und komplette Datensnapshots

Wer tiefer einsteigen oder größere Datenmengen analysieren möchte, kann bei OpenAlex auch direkt auf die Rohdaten zugreifen. Über die API und frei verfügbare Datensnapshots stehen sämtliche Inhalte auch für eigene Auswertungen und Anwendungen bereit.

  • API
    Die OpenAlex-API ermöglicht bis zu 100.000 Anfragen pro Tag und unterstützt komplexere Filter und Suchmöglichkeiten. Sie eignet sich damit besonders für wiederkehrende Recherchen oder größere Datenauswertungen. Das Vorgehen mit Beispielen findet sich in der offiziellen Dokumentation.
  • Snapshots
    Für umfangreiche Auswertungen bietet OpenAlex auch sogenannte OpenAlex-Snapshots an – vollständige Kopien der gesamten Datenbank, die monatlich aktualisiert und offen bereitgestellt werden. Wie für die API steht auch hierzu eine umfassende Dokumentation zur Verfügung.

5. Eindrücke zu OpenAlex

OpenAlex ist eine kostenlose und offene Alternative zu kommerziellen Datenbanken wie Elseviers Scopus und Clarivates Web of Science. Mit mehr als 243 Millionen verzeichneten Werken bietet sie eine größere Datenbasis als die beiden etablierten Dienste, die an der TUHH seit vielen Jahren über die TUB lizenziert und bereitgestellt werden.

Ein klarer Vorteil von OpenAlex liegt in der offenen Zugänglichkeit, der Transparenz der Datenquellen und einer breiteren inhaltlichen Abdeckung. So werden nicht nur klassische Zeitschriftenartikel und Bücher, sondern auch graue Literatur (bspw. Projektberichte, Konferenzpapiere), Preprints und nicht-englische Forschung berücksichtigt. Die transparente Darstellung von Quellen und Datenherkunft macht OpenAlex zu einer verlässlichen Grundlage für wissenschaftliches Arbeiten im Sinne einer guten wissenschaftlichen Praxis. OpenAlex unterstützt damit aktiv die Prinzipien von Open Science.

5.1 Worauf sollte man achten?

Trotz zahlreicher Stärken gibt es einige Punkte, die bei der Nutzung berücksichtigt werden sollten. Da OpenAlex ein vergleichsweise junger Dienst ist, kann es bei der Weboberfläche mitunter zu Verzögerungen oder kleinen technischen Aussetzern kommen. In den vergangenen Monaten hatte ich dieses Problem zum Beispiel beim Nachladen von Filtern oder wenn Suchanfragen hängen geblieben sind.

Dem Verlust von Suchergebnissen kann man zumindest teilweise mit einem kostenlosen OpenAlex-Account entgegenwirken. Wer sich registriert, kann Suchanfragen abspeichern und auch sogenannte Alerts einrichten. Eine Funktion, die man auch von kommerziellen Angeboten kennt. Somit wird man automatisch per E-Mail informiert, sobald es neue Treffer zu einer gespeicherten Suchanfrage gibt.

Auch wenn OpenAlex zahlreiche Datenquellen nutzt: Es kann bei den Metadaten zu Unstimmigkeiten kommen. Mir sind unter anderem falsche Zuordnungen von Autor*innen zu Einrichtungen aufgefallen. Solche Fehler lassen sich jedoch unkompliziert über eine Anfrage zur Korrektur und Ergänzung von Daten melden, sodass die Datenqualität auch hier zunehmend besser werden sollte.

5.2 Zugang zu Volltexten

Eine Herausforderung vieler Datenbanken – und somit auch von OpenAlex – ist der eingeschränkte Zugang zu Volltexten. Nicht alle wissenschaftlichen Publikationen sind im Open Access frei verfügbar, da viele Verlage Inhalte hinter Paywalls anbieten. Es handelt sich also weniger um eine OpenAlex-spezifische Herausforderung, sondern vielmehr um eine grundlegende Herausforderung für die Wissenschaftscommunity: Wie sollten wissenschaftliche Publikationen im Optimalfall finanziert und zugänglich gemacht werden?

5.3 Umgang mit Predatory Journals

Ein weiterer Punkt betrifft die Qualitätssicherung: OpenAlex schließt Inhalte aus sogenannten Predatory Journals (siehe auch TUB-Infoseite Predatory Journals und Fake Konferenzen) nicht grundsätzlich aus. Diese Journals verlangen oft Publikationsgebühren, ohne dabei etablierte wissenschaftliche Standards wie Peer Review oder redaktionelle Qualitätssicherung einzuhalten. Anders als Scopus oder Web of Science, die versuchen, solche Titel aktiv aus der Datenbasis herauszuhalten, setzt OpenAlex hier auf Transparenz (potenziell problematische Inhalte werden nicht entfernt, sondern bleiben sichtbar und können ggf. nachvollziehbar eingeordnet werden).

Mit dem gezielten Einsatz von Filtern lässt sich dies bei der „Ergebnisqualität“ jedoch berücksichtigen. So kann beispielsweise der Filter „indexed by DOAJ“ verwendet werden, um ausschließlich Zeitschriften anzuzeigen, die im Directory of Open Access Journals gelistet sind – einem Verzeichnis, das klare Qualitäts- und Transparenzkriterien wie Peer Review, ethische Standards und nachvollziehbare Geschäftsmodelle voraussetzt.

6. Fazit

Mehr als nur Literaturrecherche
OpenAlex ist nicht nur ein hilfreiches Werkzeug für die klassische Literaturrecherche, sondern bietet auch weiterführende Möglichkeiten im Umgang mit wissenschaftlichen Informationen. So lassen sich beispielsweise Netzwerkanalysen durchführen (zur Untersuchung wissenschaftlicher Kooperationen), der wissenschaftliche Einfluss einzelner Publikationen oder Institutionen analysieren (Impact-Analysen) oder Visualisierungen wissenschaftlicher Strukturen erstellen.

Anwendungsbeispiel aus der Praxis
Ein prominentes Beispiel ist das Leiden Ranking Open Edition, das auf OpenAlex-Daten basiert und ein transparentes, reproduzierbares Bewertungssystem für Universitäten bietet. Auch innerhalb der TUB findet OpenAlex Anwendung – unter anderem für Datenabgleiche im Rahmen interner Analysen und Berichte.

Was (noch) nicht perfekt ist
Trotz dieser Stärken ist OpenAlex (noch) nicht perfekt: Die Weboberfläche kann stellenweise träge wirken, Metadaten sind nicht immer ganz konsistent, und es gibt derzeit keine automatische Filterung fragwürdiger Journals. Diese Aspekte sind jedoch überschaubar und lassen sich mit etwas Aufmerksamkeit gut ausgleichen.

Lohnenswerte Ergänzung im Recherchealltag
Ich persönlich finde, dass OpenAlex sich gerade durch die Kombination aus Offenheit und Transparenz von anderen Datenbanken abhebt. Wenn man bisher „nur“ mit Scopus oder Web of Science gearbeitet hat, wird man vielleicht überrascht sein, was ein kostenfreies Angebot wie OpenAlex unter anderem in Bezug auf inhaltliche Vielfalt oder auch Filterfunktionen kann.

Aus meiner Sicht lohnt es sich, OpenAlex als ergänzende Quelle in die eigene Suchstrategie einzubinden. In Kombination mit etablierten Recherchetools lässt sich so ein umfassenderes Bild der relevanten Fachliteratur gewinnen – und die Wahrscheinlichkeit erhöhen, keine wichtigen Veröffentlichungen zu übersehen.


CC BY 4.0
Weiternutzung als OER ausdrücklich erlaubt: Dieses Werk und dessen Inhalte sind – sofern nicht anders angegeben – lizenziert unter CC BY 4.0. Nennung gemäß TULLU-Regel bitte wie folgt: Was ist OpenAlex – und wie kann man es für die Recherche nutzen? von Florian Hagen, Lizenz: CC BY 4.0. Der Beitrag und dazugehörige Materialien stehen auch im Markdownformat und als PDF zum Download zur Verfügung.