40.000 zeillen 2 von 4 Spalten vergleichen
Verfasst: So, 31.03.2013 20:41
hallo ich hoffe diese frage is noch nirgens gestellt wurden fals doch entschuldigt bitte und würd mich über links zu der frage freun.
da die suche nicht im erweiterten modus arbeitet und normale suche keine wirklichen treffer ergab.
also ich habe extrem viele zeilen die ich vergleichen möchte bzw. dublicate entfernen will.
in spalte A & B und D & E sind daten wobei nur A & D duchsucht werden soll die doppelten aus D & E entfernt werden.
es handelt sich um rapidshare datein die auf mehreren accs liegen. um nun dort die doppelten zu finden habe ich mir die werte MD5 (spalte A&D) und den downloadlink (B&E) von jeweiligen acc genommen um dann halt anhang der MD5 spalten die doppelten zu finden.
aso A&B sollen nur für die suche sein sprich alles was in A steht und in D gefunden wird soll dann aus D&E entfernt werden oder nicht gefundene in eine neue ablage kommen.
könnt mir da wer helfen wie ich so die doppelten aussortieren kann.
wäre sehr dankbar
da die suche nicht im erweiterten modus arbeitet und normale suche keine wirklichen treffer ergab.
also ich habe extrem viele zeilen die ich vergleichen möchte bzw. dublicate entfernen will.
in spalte A & B und D & E sind daten wobei nur A & D duchsucht werden soll die doppelten aus D & E entfernt werden.
es handelt sich um rapidshare datein die auf mehreren accs liegen. um nun dort die doppelten zu finden habe ich mir die werte MD5 (spalte A&D) und den downloadlink (B&E) von jeweiligen acc genommen um dann halt anhang der MD5 spalten die doppelten zu finden.
aso A&B sollen nur für die suche sein sprich alles was in A steht und in D gefunden wird soll dann aus D&E entfernt werden oder nicht gefundene in eine neue ablage kommen.
könnt mir da wer helfen wie ich so die doppelten aussortieren kann.
wäre sehr dankbar