Guten Abend Lorbass und Paljass,
ihr habt mir nun beide zwei unterschiedliche und elegante Wege gezeigt, wie ich die Häufigkeiten bestimmter Wörter bzw. Wortkombinationen herausfinden kann. Dafür bin ich euch einen Dank schuldig, den ich hiermit vollbringe:

!
Bzgl. meiner zweiten Fragestellung bestehen immer noch Unklarheiten, ich bitte mich zu entschuldigen, weil ich mich nicht einfach konkret ausdrücken kann.
Aber mit
Wortkombinationen meinte ich eigentlich nicht die Kombination innerhalb einer Zelle, sondern die Kombinationen von Wörtern (besser: Zellinhalte!) innerhalb einer
Zeile. Da eine Zeile also immer eine Einheit bildet, sollten sie bei der zweiten Fragestellung auch nicht vermischt werden, weil diesmal, wie gesagt, die Kombination von Zellinhalten innerhalb der Zeilen miteinander verglichen werden.
Du schreibst in deiner Beispieldatei
„in diesem Beispiel wäre die häufigste Wortkombination „Fagus sylvatica“ und „combined increment analysis““. (Daneben ist übrigens auch die Kombination „permanent sample plots“ zwei mal vertreten.)
"permanent sample plots" zählten demnach nicht zur Auswahl. Hinzu käme aber noch die Kombination "Biodiversity" und "species diversity", die ich zuvor übersehen hatte! Zur Verdeutlichung der Sache schicke ich euch hierzu nochmal die verbesserte Tabelle:
download/file.php?mode=view&id=8611
Zur besseren Verständlichkeit: Die Zellinhalte (von welchen noch einige mehr vorhanden sind...) sind allesamt Keywords von wissenschaftlichen Artikeln. Eine Zeile entspricht also immer der Sammlung der Keywords eines Artikels. Um nun eine Themenschwerpunkt-Analyse aller Artikel zu machen, interessieren mich also auch die häufigsten Kombinationen der Keywords.
Nach diesem halben Roman will ich erstmal schließen und habe schon ein ganz schlechtes Gewissen, euch so zu malträtieren!
Ich danke euch,
viele Grüße,
Tilla