Seite 1 von 3

Die 1 Million am meisten gesuchten Begriffe ermitteln

Verfasst: 09.05.2015, 09:18
von ChristianKand
Hallo zusammen,

für eine Studienarbeit brauche ich die 1 Millionen am häufigsten gesuchten Begriffe, die bei Google angegeben werden (bezogen auf das monatliche Suchvolumen, Saisonschwankungen unberücksichtig).

Wie würdet ihr diese ermitteln? Ein Ansatz von mir war, die Wörter des Dudens auf ihr Suchvolumen hin zu prüfen und diese dann aufzulisten. Mir viel jedoch relativ schnell auf, dass sehr viele Wörter hier nicht abgedeckt sind (z.B. "The Avengers 2").

Welches vorgehen würdet ihr mir empfehlen?

Danke!

Verfasst:
von

Verfasst: 09.05.2015, 11:00
von hanneswobus
christian,
faszinierende aufgabe, die dir da gestellt wurde. was ist eigentlich da der tiefere sinn einer solchen großen datenerhebung?

ich wuerde dir den weg ueber ein thesaurus empfehlen. interessant ist auch: https://www.danielnaber.de/morphologie/. hier findest du eine umfangreiche wortdatenbank, die du dann per schleife analysieren kannst. ansaetze waere die api von gtrends u. keywordplaner
gruß

Verfasst: 09.05.2015, 13:23
von web_worker
Hmm, der ein oder andere würde dir für solch eine Liste inklusive Suchvolumen bestimmt einiges an Kohle hinblättern. Ich denke nicht, dass du einigermaßen relevante Zahlen ermitteln kannst. Aber leichte Aufgaben wären ja auch langweilig...

Mit dem Keywordtool von Adwords kannst Du ja mal anfangen. Die ersten 100 schaffst Du da mit ein wenig Fleiß...

ww

Verfasst: 09.05.2015, 14:57
von ChristianKand
Hmm, leider habe ich keine Methodik aus euren Antworten herauslesen können.

Ich kenne die Adwords-Api sehr gut, jedoch muss ich hier immer Begriffe vorgeben, zu denen ich mir dann das Suchvolumen anzeigen lassen kann. Den hierfür benötigten Wortstamm brauche ich jedoch erstmal. Hier einfach alle Wörter eines Wörterbuchs durchlaufen zu lassen bringt nach meinen bisherigen Forschungen rein gar nix.

Betrachten wir hierzu mal die 10 Top Suchbegriffe von 2014 von G-Trends:

WM 2014, Michael Schumacher, iPhone 6, ImmobilienScout24, BSI Sicherheitstest, Robin Williams, Dschungelcamp 2014, Conchita Wurst, Kicktipp, Ebola

Von dieses 10 Begriffen stehen gerade einmal 2 Stück im Duden!

Es wäre dementsprechend fatal für die weitere Analyse den Datenstamm aus einer Kombination von Duden/Wortbuch-Begriffen und Suchvolumen als häufigste Suchbegriffe anzusetzen.

Natürlich war meine erste Idee ebenfalls Google-Trends zu befragen. Nur sind mir 10 Suchbegriffe einfach zu wenig.

Jemand noch weitere Ideen?

Verfasst: 09.05.2015, 15:08
von hanneswobus
ChristianKand hat geschrieben:Hmm, leider habe ich keine Methodik aus euren Antworten herauslesen können.
mh. ist es heutzutage ueblich, dass man wildfremde personen "methodiken" fuer eigene wiss. arbeiten ausformulieren laesst? irgendwie muessen sich die zeiten ja massiv geaendert haben ...
ChristianKand hat geschrieben: Ich kenne die Adwords-Api sehr gut, jedoch muss ich hier immer Begriffe vorgeben, zu denen ich mir dann das Suchvolumen anzeigen lassen kann. Den hierfür benötigten Wortstamm brauche ich jedoch erstmal. Hier einfach alle Wörter eines Wörterbuchs durchlaufen zu lassen bringt nach meinen bisherigen Forschungen rein gar nix.
dann suche dir andere datendienstleister.
ChristianKand hat geschrieben: Von dieses 10 Begriffen stehen gerade einmal 2 Stück im Duden!
dann verwende andere datenbanken, eine variante habe ich dir genannt.
ChristianKand hat geschrieben: Es wäre dementsprechend fatal für die weitere Analyse den Datenstamm aus einer Kombination von Duden/Wortbuch-Begriffen und Suchvolumen als häufigste Suchbegriffe anzusetzen.
siehe mein hinweis auf andere datenbanken, andere wortdatenbanken. mit etwas kreativitaet kommt man hier aeusserst schnell zum ergebnis
ChristianKand hat geschrieben: Natürlich war meine erste Idee ebenfalls Google-Trends zu befragen. Nur sind mir 10 Suchbegriffe einfach zu wenig.
da bist du schon ganz gut "aufgehoben". ich wuerde g-trends allerdings bei solchen analysen max. als eine art "gegenprobe" verwerten.
ChristianKand hat geschrieben: Jemand noch weitere Ideen?
natuerlich, ich habe jede menge ideen u. ich beschaeftige mich seit einiger zeit mit dem thema "wortgewichtung" oder der frage "welches-wort-spricht-welches-klientel-warum-an?". obwohl ich aeusserst wenig motivation habe, dich kostenfrei mit den ergebnissen aus meiner "forschung & entwicklung" zu versorgen, moechte ich dir einen tipp geben: verwende mal als "quelle der inspiration" die verwendeten worte in form von "hashtags" bei hashtaglastigen socialmedia. entsprechende plattformen bieten hinreichend sauber dokumentierte apis, worueber man relativ problemlos mit eigenen ansaetzen u. algos dinge analysieren kann.

ggf. bin ich etwas entspannter u. redefreudiger, wenn du hier mal etwas mehr infos zu deiner "studie" herunter schreibst.

gruß

Verfasst:
von

Verfasst: 09.05.2015, 20:14
von H G
Als nicht-Programmierer hatte ich mal die verrückte Idee aufgestellt einen Webcrawler zu programmieren der jedes Wort auf den besuchten Seiten scraped und anschließend mit Suchvolumen (etc.) anreichert.

Ich weiß nicht ob sowas überhaupt/mit deinen Mitteln umsetzbar ist, aber vielleicht wäre dass ja eine Methodik ?

Verfasst: 09.05.2015, 20:31
von hanneswobus
hg,
ich denke da an witzige sachen wie 1. worte besorgen (woerterbuch, g-suggest, xovi-datenbanken, div. wmt-geschichten) => 2. ueber instagram-api jagen. warum finde ich diesen ansatz faszinierend? ganz einfach: die instagram-api gibt aus, wie haeufig wort xyz als "hashtag" verwendet wird u. welche / wieviele abwandlungen dazu existieren. ich unterstelle also einem wort, was a) viele abwandlungen (im vergleich zu ...) u. eine moeglichst hohe haeufung (im vergleich zu ...) bei der nutzung hat eine gewisse "wertigkeit". was das scrapen der suchvolumina angeht ... da haette ich keine idee, wie man das ohne folgekosten u. mit recht wenig aufwand hinbekommen kann.
gruß

Verfasst: 13.05.2015, 23:06
von ChristianKand
Hallo zusammen,

wir haben nun folgende Methodik entwickelt.

1. Es wird mit einem frei gewähltem Keyword wie z.B. "test" begonnen
2. Es werden die Google-Suggestions zu diesem Keyword herrausgefunden (hiermit gehen wir sicher, dass es sich bei den Keywörter um Suchbegrifffe handelt, die schon einmal bei Google eingegeben wurden).
3. Es wird zu allen ermittelten Suggestions das Suchvolumen bestimmt
4. Das ganze beginnt von vorne mit dem Keyword, welches am meisten Suchvolumen hatte.

Was haltet ihr von dem Ansatz?

Verfasst: 14.05.2015, 00:06
von hanneswobus
ChristianKand hat geschrieben: Was haltet ihr von dem Ansatz?
=>nichts<=
wer ist eigentlich "wir" ich ging eigentlich nur von einzelner person aus - also von DIR.

Verfasst: 14.05.2015, 00:15
von ChristianKand
Eine Begründung fände ich für das "=> nichts <=" gut.

Es ist schon so, dass ich mich auch mit anderen Leuten in der Uni über das Thema berate, daher WIR.
Ist es in irgendeiner Weise überhaupt entscheidend? Was soll denn diese generelle Abneigung????

Verfasst: 14.05.2015, 00:30
von hanneswobus
ChristianKand hat geschrieben:Eine Begründung fände ich für das "=> nichts <=" gut.

Es ist schon so, dass ich mich auch mit anderen Leuten in der Uni über das Thema berate, daher WIR.
Ist es in irgendeiner Weise überhaupt entscheidend? Was soll denn diese generelle Abneigung????
ich habe keine generelle (!) abneigung gegen deinen ansatz :-) ich habe nur bedenken gegenueber deiner herangehensweise. :-)

Re: Die 1 Million am meisten gesuchten Begriffe ermitteln

Verfasst: 14.05.2015, 01:13
von nerd
ChristianKand hat geschrieben:Hallo zusammen,

für eine Studienarbeit brauche ich die 1 Millionen am häufigsten gesuchten Begriffe, die bei Google angegeben werden (bezogen auf das monatliche Suchvolumen, Saisonschwankungen unberücksichtig).
Die fragestellung an sich ist schon quatsch. Was genau willst du rausfinden? "1 Millionen am häufigsten gesuchten Begriffe" - wo? In deutschland? im deutschsprachigen raum? Weltweit?
Was machst du mit laendern, in welchen google nicht die erste geige spielt (china, russland)? Was sagt es dir, wenn "Cricket" vor "Fussball" kommt, oder irgendwelche bollywood stars aus indien populaerer sind als harald schmidt?
Der ansatz mit dem woerterbuch ist unsinn, ich glaube nicht dass dort produktnamen wie iPhone, Battlefield4 oder andere markennamen (nach welchen zweifellos haeufig gesucht wird!) oder internet slang mit abgedeckt wird. Ein guter teil der populaeren suchanfragen wird wohl auh nicht ganz jugendfrei sein; ich weiss nicht ob du dafuer weitere suchvorschlaege bekommst.
Pass auf dass dein crawler dir keinen platz auf irgendeiner watchlist verschafft, wenn er jede menge suchanfragen zur politischen und religioesen lage und den fraktionen im nahen osten macht... :wink:

Ansonsten: https://www.google.de/trends/

Verfasst: 14.05.2015, 11:56
von ChristianKand
Hi nerd,
also es geht um Deutschland und was die Deutschen suchen. Die Fragestellung bezieht sich generell darauf, zu kategorisieren, was die Deutschen im Internet suchen und dahergehend abzuleiten, was sie beschäftigt.

Ich teste gerade den Ansatz mit den Suggestions, wenn ich eine geeignete Menge habe, würde ich gerne mal von euch eure Meinung zu den Top 50 hören.

Trends liefert mir zu wenig Daten.

Mit den nicht jugendfreien Wörtern hast du recht. Hier muss ich mir noch was überlegen.

Verfasst: 14.05.2015, 12:42
von hanneswobus
christian,
die suchvorschlaege sind zwar ganz nett, liefern aber keinen hinweis auf die frage "wird das zeug ueberhaupt gesucht?". ich empfehle bei solchen aktivitaeten aus "forschen & entwickeln" immer den umweg ueber die socials. also: hashtags scrapen, gewichten => gegenprobe auf gtrends, gsuggest, gutefrage.net. ansaetze findest du in der doku von instagram, in den twittertrends u. mit der richtigen herangehensweise bekommst du hieraus durchaus ein abbild von interessen. hier solltest du natuerlich gewichtungs- und bewertungsfunktionen erfinden ... eine pauschale auflistung wie "gugge ma. das interessiert leute" ist ja nicht unbedingt foerderlich fuer die ableitung von konkreten handlungen, strategien usw.
gruß

Verfasst: 14.05.2015, 16:54
von tuennes
Meiner Meinung nach gibt es keinen anderen seriösen Ansatz als mit einer Suchmaschine zusammenzuarbeiten. Am besten mit Google Deutschland. Einfach mal anrufen oder einen Brief per Post schicken. - Ich schätze deine Chancen nicht groß ein, aber vielleicht klappt es ja. Eventuell kannst du ja auch deinen Prof für dich einspannen. Das macht mehr Eindruck.