Open-Access-Suchmaschinen

Für Open Access relevante Suchmaschinen

Traditionell sind Literaturrecherche und Literaturbeschaffung verschiedene, zeitlich versetzte Vorgänge. Durch Open Access wird die Trennung zwischen beiden Vorgängen faktisch aufgehoben. Neben den bekannten Vorteilen des Open Access liegt der besondere Nutzen für die thematische Suche darin, dass sich aus der unmittelbaren Einsichtnahme in die gefundenen Dokumente häufig Hinweise für eine Optimierung oder Korrektur der Suchstrategie ergeben. Dazu braucht man Suchmaschinen, die Open-Access-Dokumente nachweisen können. Ein gleichfalls wichtiges Anwendungsfeld für derartige Suchmaschinen ist die bibliographische Suche, da zu vielen Open-Access-Dokumenten entsprechende Metadaten vorliegen. Die vorliegende Seite gibt einen Überblick über fachübergreifende Suchmaschinen, die unter den genannten Aspekten für die Suche nach Open-Access-Dokumenten geeignet sind.

BASE ist eine multidisziplinäre wissenschaftliche Suchmaschine der Universitätsbibliothek Bielefeld für frei zugängliche Dokumente mit Schwerpunkt auf Dokumentservern.

Inhalt:

Über 25 Mio. Dokumente aus über 1700 Quellen (Stand September 2010). Hoher Anteil OAI-kompatibler Quellen, die nach dem OAI-PMH-Standard (Open Archives Initiative - Protocol for Metadata Harvesting) ausgewertet werden; ein kleinerer Teil sind Internetquellen wissenschaftlicher Organisationen und Webseiten sowie Digitalisate der Universitätsbibliothek Bielefeld.

Die inhaltliche Palette umfasst Artikel, Bücher, Dissertationen, Papiere, Rezensionen, Audios, Bilder, Videos, Primärdaten, Noten.

Indexierung:

Indexierung aller Metadaten und der Volltexte aus etwa 40 Quellen.

Suche:

Einfache Suche: Google-ähnliche Suche mit einzeiliger Eingabebox. Erweiterte Suche mit differenzierten bibliographischen Suchmöglichkeiten (insgesamt sieben Suchaspekte) und Auswahlmenüs für eine Einschränkung nach Dokument- bzw. Medientyp, Region und Quellenart. Suchbegriffserweiterung durch automatische Suche nach Wortvarianten (Plural, Genitiv), durch mehrsprachige Suche oder Einbeziehung verwandter Suchbegriffe (Eurovoc-Thesaurus). Stichwörter können trunkiert (mit Platzhalter versehen) oder mit logischen Operatoren verknüpft werden. Dynamisch generiertes Auswahlmenü zur Verfeinerung der Suchergebnisse.

Anzeige und Zusatzfunktionalitäten:

Alternativ zum Ranking nach Relevanz werden verschiedene Sortiermöglichkeiten (auch nach Erscheinungsjahr) angeboten. Ausführliche Trefferbeschreibungen mit einem Cross Searching Link zu Google Scholar, um zitierende Dokumente oder andere Versionen zu finden.

Bewertung:

Sowohl für thematische als auch bibliographische Suchen empfehlenswert. Vorteile: Benutzerfreundlichkeit, der Metadatensuche angemessene effiziente Retrieval-Funktionalitäten, vergleichsweise hohe bibliographische Zuverlässigkeit. Bedingt durch die Auswahl der Quellen findet man auch viele Dokumente des Invisible Web. Vergleichsweise hohe Quote an Treffern, die im Volltext zugänglich sind.

Google Scholar ist eine auf wissenschaftliche Literatur spezialisierte Variante der Suchmaschine Google. Das besondere Open-Access-Potenzial liegt in der Identifizierung und Kennzeichnung (in der Trefferanzeige) von frei zugänglichen wissenschaftlichen Texten im weltweiten Web.

Obwohl offiziell noch im Beta-Status befindlich ist die Praxistauglichkeit voll gegeben.

Inhalt:

Genauere Angaben sind von Google nicht erhältlich. In den Ergebnissen der Volltextsuche in etwa mit Scirus vergleichbar.

Den Hauptanteil der Dokumente machen Zeitschriftenartikel aus. Weiter enthalten sind: Konferenzbeiträge, Preprints, Postprints, Reports, Dissertationen, Diplomarbeiten, Seminararbeiten, Metadaten aus Indexing/Abstracting Services, Bücher (Google Books), Zitate.

OAI-kompatible Repositorien werden weniger vollständig ausgewertet als z.B. in OAIster oder der OpenDOAR Search; es werden aber in erheblichem Umfang Web-Dokumente und Postprints z.B. auf persönlichen oder institutionellen Webseiten sowie in nicht OAI-kompatiblen Repositorien nachgewiesen.

Nachweis frei zugänglicher Dokumente in den Trefferlisten:

Ein frei zugängliches Dokument der Trefferliste (mit Verlinkung des Titels auf den Volltext) wird durch ein grünes Dreieck links neben dem Titel gekennzeichnet. Existiert zu einem nicht frei zugänglichen Dokument der Trefferliste eine frei zugängliche Version, wird der Volltext-Link (Servername) rechts neben dem Titel angezeigt. Der Anteil der Treffer, die im Volltext zugänglich sind, liegt je nach Thematik in einem Bereich von 25% bis 60%.

Indexierung:

Volltextindexierung der Dokumente bzw. Dokumentbeschreibungen

Suche:

In der erweiterten Suche werden neben der von Google bekannten Stichwort- und Wortgruppensuche zusätzliche bibliographische Suchfelder für Autor, Quelle (insbesondere Zeitschrift) und Erscheinungszeitraum angeboten, deren automatische Identifizierung aber nicht zuverlässig und teilweise fehlerhaft ist. Ranking ähnlich wie bei Google mit besonderer Berücksichtigung der Zitierhäufigkeit.

Anzeige und Zusatzfunktionalitäten:

Zusammenführung verschiedener Versionen (Instanzen) einer Publikation, Nachweis zitierender Dokumente aus Google Scholar.

Bewertung:

Besonders gut geeignet für thematische Einstiegsrecherchen. Wegen der Volltextindexierung und des breiten Spektrums der ausgewerteten Quellen werden vergleichsweise viele freie Dokumente ermittelt. Die auf den ersten Trefferseiten angezeigten sind daher entsprechend relevant. Zusatzrecherchen zum Stand der Forschung sind nicht unbedingt erforderlich, da sowohl frei zugängliche als auch nicht frei zugängliche Dokumente nachgewiesen werden.

Für bibliographische Recherchen wegen der genannten Mängel sowie der fehlenden chronologischen Sortiermöglichkeit eher nicht zu empfehlen.

Umfassender Metadatenkatalog für den weltweiten Nachweis von Dokumenten in OAI-PMH-kompatiblen Repositorien und digitalen Bibliotheken, der seit Februar 2010 als WorldCat-Datenbank bei OCLC frei zugänglich ist. OAIster startete als Projekt der University of Michigan University Library für die Praxiserprobung des Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH). Der Suchmaschinendienst wurde dort bis Oktober 2009 angeboten und war als einschlägiger Nachweisdienst weltweit ein Begriff. Nach einer Kooperationsphase mit OCLC in 2009 war OAIster eine Zeit lang nur für OCLC-Kunden nutzbar.

Inhalt:

Über 23 Mio. Dokumente aus 1100 überwiegend OAI-kompatiblen Quellen, darunter Zeitschriftenartikel, Research Papers, Dissertationen, Postprints, Preprints, Reports, Audio-Dateien, Bild-Dateien, Movies, Datensammlungen – als elektronische Originale oder in digitalisierter Form (Stand: April 2010).

Indexierung:

Metadatenindexierung

Suche:

Wahlmöglichkeit zwischen einer einzeiligen Suche auf der Startseite und einer erweiterten Suche. Die erweiterte Suche besitzt drei Eingabefelder mit jeweils 14 einstellbaren Suchaspekten (auch "Subject") sowie Möglichkeiten der Einschränkung nach Erscheinungszeitraum, Sprache ("English", "Non-English") und Medientyp. Die einzeilige Suchmaske beinhaltet ein funktionsloses Pull-down-Menü . Bei der Sucheingabe können die Suchbegriffe auch direkt mit insgesamt 20 codierten Suchaspekten kombiniert werden (Expertensuche). Auf den Ergebnisseiten zu einer Suche wird die Möglichkeit einer Verfeinerung der Suche unter den Suchaspekten "Autor" und "Jahr" angeboten.

Anzeige und Zusatzfunktionalitäten:

Die Trefferliste kann wahlweise nach Relevanz, Autor, Titel oder aufsteigend oder abfallend nach Erscheinungsjahr sortiert werden. In der Kurzanzeige eines Treffers erscheinen außer den bibliographischen Angaben (Titel, Autoren, Verlag) auch zwei konstante Felder – für die Datenbank und den "Besitznachweis" in WorldCat-Bibliotheken. Das Feld "Verlag" enthält oft unklare, aus zwei gleichen oder zwei verschiedenen Jahreszahlen bestehende Erscheinungsdaten. Hier wie in der verlinkten Vollanzeige der Metadaten werden Mängel beim Mapping der Metadaten sichtbar. Die Metadaten eines Treffers, die Abstracts und Sachgruppenbezeichnungen ("Identifier") beinhalten, werden innerhalb einer unübersichtlichen, überdimensionierten Formularanzeige präsentiert. Sie enthält Ballast in Form von bibliothekstypischen Feldern und Funktionalitäten wie Bestell- und Bestandsnachweise oder Nutzerlisten. Wertvoll sind dagegen die Links zu Zitier- und Download-Informationen von citebase.org.

Es kann zwischen sechs verschiedensprachigen Oberflächenversionen gewählt werden; die Voreinstellung ist nutzerabhängig.

Bewertung:

Empfehlenswert für die Suche nach Dokumenten in Repositorien, insbesondere OAI-PMH-kompatiblen Quellen. Mit der mehrmonatigen Unterbrechung des öffentlichen Zugangs und einer noch ausstehenden, überfälligen Verschlankung der entbehrliche Optionen und Felder enthaltenden Oberfläche ist OCLC den Erwartungen hinsichtlich Kontinuität und Pflege des traditionsreichen Dienstes bisher nicht voll gerecht geworden. Die Migration zu OCLC hat einige funktionale Verbesserungen gebracht, aber auch Verschlechterungen in Bezug auf Konsistenz und optische Präsentation der Metadaten. Die führende Rolle in Bezug auf einen qualifizierten und umfassenden Nachweis von Dokumenten in Repositorien muss sich OAIster inzwischen mit der wissenschaftlichen Suchmaschine BASE teilen.

Die OAN-Suche ist eine innerhalb des DFG-Projekts Open-Access-Netzwerk entwickelte Rechercheoberfläche für den Nachweis von Dokumenten in DINI-zertifizierten Repositorien, die in einer ersten, auf Basisfunktionen von Suche und Browsing beschränkten, noch im Alpha-Status befindlichen Version genutzt und besichtigt werden kann. Das darunter liegende System ist als verteilte Anwendung auf den Rechnern der Projektpartner implementiert. Die für die Suche verwendeten Metadaten werden über den OAI-PMH-Standard (Open Archives Initiative - Protocol for Metadata Harvesting) aus den Repositorien exportiert; in umgekehrter Richtung wird auf die verteilt gespeicherten Volltexte verlinkt.

Inhalt:

Dokumente aus 33 DINI-zertifizierten Repositorien (Stand Oktober 2009)

Indexierung:

Metadatenindexierung

Suche:

Einzeilige Suchbox. Die Sucheingabe kann aus einem oder mehreren aufeinander folgenden Wörtern  des Titels, aus dem Namen eines Autors  oder aus dem Text eines Schlagworts bestehen (dagegen nicht aus dem Text einer Zusammenfassung). Die Suche kann nach Gruppen oder Untergruppen der Dewey-Dezimalklassifikation eingeschränkt werden.

Anzeige und Zusatzfunktionalitäten:

Die Trefferbeschreibungen in der nach Repositorien sortierten Trefferliste enthalten neben Titel und Autorennamen die zugeordneten Schlagworte, die Dokument-Adresse, das Repository und die Sprache (Flaggensymbol). Zu jedem Treffer kann eine sämtliche Metadaten einschließlich Abstract beinhaltende Langanzeige aufgerufen werden.

Zwei innerhalb des gleichen Projekts entwickelte Mehrwertdienste betreffend Nutzungsstatistik und Zitationsanalyse sollen mittelfristig in die Rechercheoberfläche integriert werden.

Open J-Gate ist eine von der Informatics India Ltd. gesponserte Suchmaschine für den Artikelnachweis in Open-Access-Zeitschriften.

Inhalt:

Über 300.000 Zeitschriftenartikel aus 6050 frei zugänglichen Zeitschriften. Die Zahl der begutachteten und damit eigentlichen Open-Access-Zeitschriften liegt bei etwa 3500 (Stand Oktober 2009).

Indexierung:

Volltextindexierung und Metadatenindexierung

Suche:

Einfache und erweiterte Suche, die jeweils auf die begutachteten Zeitschriften (oder die anderen) eingeschränkt werden kann. Erweiterte Suche mit drei spezifizierbaren Suchfeldern und fachlich-systematischer Einschränkungsmöglichkeit über ein Auswahlmenü mit zweifach hierarchisch untergliederten Fachgruppen. Unterstützend wird für die Zeitschriften ein Browsing nach Titel, Verlag oder Fachgebiet angeboten.

Anzeige und Zusatzfunktionalitäten:

Erstmalige Trefferanzeige als chronologisch sortierte Titelliste. Das Anzeigefeld eines Treffers der Liste kann (umkehrbar) zu einer detaillierten Beschreibung mit Abstract expandiert werden. Der Volltextzugriff erfolgt über ein Auswahlmenü der jeweils möglichen Dateitypen.

Bewertung:

Speziell für Artikel in Open-Access-Zeitschriften geeignete Suchmaschine. Artikel in Open-Access-Zeitschriften können auch über die relativ einfache Suchfunktion Find articles des Directory of Open Access Journals (DOAJ)  recherchiert werden. Auch in Scirus und Google Scholar werden Artikel in Open-Access-Zeitschriften nachgewiesen. Sie werden in Scirus aber nur in Auswahl erfasst, während sie in Google Scholar nur unzulänglich (ausschließlich über die Quelle) als Zeitschriftenartikel recherchierbar sind.

OpenDOAR Search ist ein einfaches Suchinterface für die Volltextsuche in den 1500 Repositorien des Directory OpenDOAR – dem umfangreichsten Verzeichnis seiner Art. OpenDOAR ist ein Projekt der Open-Access-Initiative SHERPA an der University of Nottingham für den Nachweis qualitätsgeprüfter institutioneller und fachlicher Repositorien und Archive wissenschaftlicher Förderorganisationen mit zahlreichen Evaluationsmöglichkeiten. OpenDOAR und OAIster werden oft in einer Reihe genannt, wenn es um Umfang und Abdeckung von Open-Access-Repositorien geht.

Inhalt:

24-29  Mio. Dokumente aus 1500 Repositorien (Stand Oktober 2009)

Indexierung:

Volltextindexierung der Dokumente via Google Custom Search; die Metadaten werden nicht indexiert, auch wenn sie OAI-kompatibel vorliegen.

Suche:

Einzeilige Google-Suche ohne zusätzliche Auswahlmenüs oder Eingabefelder.

Anzeige und Zusatzfunktionalitäten:

Trefferanzeige wie bei Google. Hier mit drei  Arten von Links, mit denen man sich zu einem Treffer die zitierenden Dokumente, ähnliche Dokumente oder alle Versionen anzeigen lassen kann.

Bewertung:

Geeignet für thematische Einstiegsrecherchen. Vorteilhaft sind die hohe Zahl qualitätsgeprüfter Repositorien sowie das Faktum der Volltextsuche. Das Zustandekommen der Suchergebnisse ist nicht transparent. Nach verschiedenen Untersuchungen werden - bezogen auf einzelne Repositorien - über die Google Custom Search erheblich weniger Dokumente zu bestimmten Suchanfragen ermittelt als über eine Google Websuche, obwohl die Trefferzahlen im Prinzip übereinstimmen sollten. Betrachtet man die OpenDOAR Search und andere OA-Suchmaschinen hinsichtlich des Retrievals dagegen als "Black Box", so erweist sich die OpenDOAR Search bei Trefferzahl-Vergleichen nichtsdestoweniger als für die thematische Suche geeignet. So liefert OpenDOAR zu der Suchanfrage "lorch meisterlin" 7 Treffer (Volltexte), Google Scholar ebenfalls 7 Treffer (2 Volltexte und 5 Zitate), die anderen außer OAIster (z.Z. nicht recherchierbar) dagegen keine Treffer (Stand November 2009).

Von der Point Software AG gesponserte, seit Februar 2010 existierende wissenschaftliche Suchmaschine für Open-Access-Publikationen aus derzeit vier großen wissenschaftlichen Datenbeständen und einer Vielzahl deutscher Repositorien (Stand März 2010).

Inhalt:

1,8 Mio Dokumente, die 1400 Universitäten und Open-Access-Zeitschriften zugeordnet werden können. Datenbasis: über 60 Mio. Datensätze. Die Datenbestände bzw. Teildatenbestände „PubMed Central”, „ArXiv.org”, „CiteSeer“ sowie die DOAJ-Artikel (Identifier: „oai:doaj-articles…“)  machen knapp 90% aller Dokumente aus (Stand März 2014).

Indexierung:

Metadatenindexierung.  

Suche:

Einzeilige Suchbox mit 12 einstellbaren Suchaspekten. Die Suche kann thematisch nach insgesamt 16 Themenbereichen eingeschränkt werden. Für mehrere eingegebene Suchbegriffe wird eine „Closest-Match“-Suche  durchgeführt.  Deren Ergebnis ist eine nach Relevanz sortierte Trefferliste beginnend mit Dokumenten, in denen alle Suchbegriffe vorkommen, gefolgt von solchen mit weniger Suchbegriffen. Daneben können mehrere Suchbegriffe auch als Wortfolge gesucht werden (Phrasensuche), wenn man sie wie gewohnt in Anführungszeichen setzt.

Anzeige und Zusatzfunktionalitäten:

Einzeilige Ergebnisliste. 10 Titel pro Seite (ohne Autorenangabe) mit anklickbarer Formatanzeige. Zu jedem Treffer werden in einer Cursor-gesteuerten Fensteranzeige (Popup-Fenster) ausführliche Metadaten mit Abstracts angezeigt, die aber nicht ausgedruckt werden können.  Die Informationen in den Popup-Fenstern sind zum Teil nicht vollständig auf dem Bildschirm sichtbar.

Bewertung:

Schlanke, vom Design ansprechende Suchmaschine mit Optimierungs- und Entwicklungsbedarf hinsichtlich Ergebnispräsentation und Vervollständigung (und Vollständigkeit) der Quellen. Es fehlen wichtige fachliche Archive und das weltweite Spektrum  institutioneller und universitärer Repositorien. Nutzer von Sciencegate müssen entsprechende Einschränkungen bei den Suchergebnissen in Kauf nehmen.

Scientific Commons ist ein Suchmaschinenprojekt des Instituts für Medien und Kommunikationsmanagement der Universität St. Gallen mit dem Ziel, frei zugängliche wissenschaftliche Ergebnisse umfassend öffentlich zugänglich zu machen. Noch im Betastatus.

Inhalt:

Über 38 Mio. Dokumente. Es werden 1269 Repositorien (Dokumentserver mit OAI-Schnittstelle) ausgewertet. Außerdem werden Webseiten mit (Metadaten enthaltenden) Literaturlisten ausgewertet, die auch angemeldet werden können. Bei den Dokumenten handelt es sich um Artikel, Dissertationen, Reports und sonstige wissenschaftliche Texte (Stand September 2010).

Indexierung:

Volltextindexierung und Metadatenindexierung der Dokumente in einer Vielzahl von Dateitypen bis zu 3 MB.

Suche:

Einzeilige Suchbox; eine erweiterte Suche ist nicht vorhanden. Die praktizierte Suchbegriffserweiterung über die Einbeziehung von Wortvarianten und Trunkierung führt oft zu unerwünschten Ergebnissen (bspw. werden zu der Eingabe "internal relativity" bevorzugt Treffer ermittelt, in denen "international relative prices" vorkommt). Die Trefferliste wird durch Scrolling nachgeladen. Das vorrangige Kriterium für das Ranking ist die Worthäufigkeit.

Anzeige und Zusatzfunktionalitäten:

Die Links der Treffer führen nicht direkt zum Volltext, sondern zunächst auf eine detaillierte Dokumentbeschreibung. Alternativ zum Ranking kann eine Sortierung nach Erscheinungsjahren eingestellt werden (mit häufigen Ausreißern in der Trefferliste). Die Ergebnisse können nur nach dem Kriterium Sprache (Deutsch und Englisch) erfolgreich eingeschränkt werden.

Bewertung:

Der Vorteil des Zugriffs auf eine erfreulich große Dokumentsammlung wird geschmälert durch die relativ ballastreichen Ergebnislisten. Die Anzeigeoptionen weisen teilweise Funktionsmängel auf. Die eingeblendeten zusätzlichen Trefferinformationen bekommt man nur mit geeigneten Systemvoraussetzungen/Browsern zu sehen. Die früher vorhandenen informativen "Publication List Details" mit Autoren- und Co-Autoren-Listen sind offenbar den hineingenommenen Werbeanzeigen zum Opfer gefallen.

Quellen

Pieper, Dirk & Wolf, Sebastian (2009). Wissenschaftliche Dokumente in Suchmaschinen. In: Handbuch Internet-Suchmaschinen. Hrsg. Dirk Lewandowski. Heidelberg 2009, S.356-374.

Norries, Michael et al. (2008). Finding open access articles using Google, Google Scholar, OAIster and OpenDOAR. Online Information Review 32 (2008) 6, pp. 709-715

Search Open Access Repositories. The Library at UCD

Wissenschaftliche Suchmaschinen im Vergleich. Universität Zürich. Geographisches Institut. Bibliothek.

Inhaltliche Betreuung der Seite

Bearbeitet/erstellt von:

Wolfgang Binder, ehemals Universität Bielefeld und Projektmitarbeiter bei der Informationsplattform open-access.net