Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Video Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Sie können Daten von jeder Webseite mit der ImportXML-Funktion von Google Sheets importieren. Hier erfahren Sie, wie Sie die ImportXML-Funktion in Google Sheets verwenden.

Wenn Sie die ImportXML-Funktion von Google Sheet beherrschen, haben Sie das Gefühl, bereits einen zertifizierten Blattassistenten zu besitzen. ImportXML erhält Informationen aus jedem XML-Feld. Dank dessen können Sie die darauf generierten Daten und Metadaten überall herunterladen.

Grundlagen von XML und HTML

Die XML-Auszeichnungssprache gibt die Datensätze auf einer Webseite an. Im Wesentlichen befindet sich jeder Satz von <something> und </ something> - den Bausteinen des Web-Quellcodes oder eines bestimmten Datensatzes - in ihnen. Der Quellcode des Webs enthält Text im <p> -Arsatz-Tag - ein Absatz, der manchmal <b> alt enthält - in Fettdruck und möglicherweise <a> einen Link - Link (gefolgt von </ a > </ b>. </ p> </ body> , um das gesamte Tag zu schließen).

Die Google Sheets ImportXML-Funktion kann einen bestimmten XML-Datensatz finden und Daten außerhalb davon kopieren. Wenn wir im obigen Beispiel alle Links auf der Seite erhalten möchten, müssen wir die ImportXML-Funktion bitten, alle Informationen in das <a> </a> -Tag einzugeben . Wenn Sie den gesamten Text eines Webs möchten, können Sie zunächst alles in <body> </ body> oder in jeder Version von <p> </ p> aufnehmen und die Daten zu einem späteren Zeitpunkt löschen.

So extrahieren Sie eine Liste mit Postleitzahl und Landkreis in der Stadt

Die Tabellen in Wikipedia sind großartige ImportXML-Übungen. In diesem Artikel wird beispielsweise die gesamte Postleitzahl in Edmonton, Alberta, heruntergeladen. Suchen Sie eine Liste der kanadischen Postleitzahlen, die mit dem Buchstaben T beginnen. Öffnen Sie diese Seite in einem neuen Browserfenster, um loszulegen.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Wählen Sie eine Postleitzahl aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Überprüfen , um das Browser-Tool zum Anzeigen der Seitenquelle zu öffnen. Sie sehen, dass sich jeder Seitenquellcode in einem Tag befindet (identifizieren Sie eine Zelle in der Tabelle). Danach importiert der Artikel alle darin enthaltenen TD-Tags aus Edmonton.

Erstellen Sie ein neues leeres Google Sheet. Der Artikel übernimmt den gesamten Inhalt des TD-Tags, einschließlich <span> und Link, indem er die Daten angibt, für die Sie die XPath-Syntax verwenden möchten. ImportXML verwendet die URL und das Tag, nach denen Sie suchen, als Argument für den Import in Google Sheets.

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td")

Sie erhalten folgendes Ergebnis:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Wenn Sie zur Seitenquelle zurückkehren, sehen Sie die Postleitzahl in Fettdruck im <b> </ b> -Tag, dem Städtenamen, der auf die Wikipedia-Artikel unter <a> </a> verweist. Versuchen Sie nun, nur Links in jeder großen Stadtbox zu erhalten und andere Links (Nachbarschaften) zu entfernen. Bearbeiten Sie sie in zwei Tastenbefehlen, Spalte A und B:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1]")

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / b [1]")

Sie müssen die Ergebnisse ein wenig verfeinern:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Diese Aktion hilft Ihnen zu verstehen, wie die XPath-Abfragesyntax funktioniert: Ein Tag stellt nur die erste Version von <tag> im <übergeordneten Tag> bereit. Daher gibt Ihnen td / span / a [1] bei jedem <td> den ersten Link in <span>. In ähnlicher Weise gibt Ihnen td / b [1] den ersten fetten Text in jedem <td> oder in diesem Fall nur die Postleitzahl.

Das Tolle ist, dass Sie zwei Abfragen in einer Funktion ausführen können. Daher kombiniert der Artikel zwei Anforderungen mit einem | -Symbol in der Mitte:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1] | // td / b [1]")

Sie erhalten jedoch nicht die gleichen vorherigen Ergebnisse. Es wird die gesamte Anforderung in einer langen Liste anstatt in zwei Spalten abgewechselt. Es hat viele Vorteile, ist aber in diesem Artikel nicht erforderlich.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Auswahl der Postleitzahl in den Feldern mit dem Link "Edmonton". Wir werden diesen Code verwenden:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / b [1]")

Setzen Sie den "Suche" -Text in eckige Klammern, um die Ergebnisse einzugrenzen, ohne die Art und Weise zu beeinflussen, wie Ergebnisse erzielt werden.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Nun zu den Namen der umliegenden Gebiete. Schreiben Sie die entsprechende importXML-Funktion in die nächste Spalte und erhalten Sie den folgenden Text von "Edmonton".

Der Artikel nimmt den gesamten Inhalt des Bereichs [1] und verwendet Klammern und Fadenkreuze, um den Inhalt zu unterteilen, wobei "Edmonton" in die erste Spalte und der Nachbarschaftsname in die folgende Spalte eingefügt werden. Wir können dann die Postleitzahl mit dem entsprechenden Namen kombinieren:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / span [1]")

Verwenden Sie als Nächstes die Funktion Teilen und verketten Sie einige der folgenden Spalten, um die verarbeiteten Daten zu teilen und zu gruppieren:

= SPLIT (verketten (B2: J2), "(/)")

Zum Schluss hier die Ergebnistabelle mit den notwendigen Informationen:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

So kopieren Sie E-Mail-Adressen automatisch aus dem Web

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

In diesem Artikel erfahren Sie, wie Sie die E-Mails aller Mitarbeiter auf der Seite "Info |" abrufen Zapier. Wenn Sie sich den Quellcode ansehen, sehen Sie, dass sich die E-Mail-Adresse jedes Mitglieds im Feld class = "email" befindet. Wenn Sie ein Tag-Attribut angeben möchten, verwenden Sie die Google Sheets ImportXML-Funktion wie folgt:

= importxml ("https://zapier.com/about//", "// span [@ class = 'email']")

So importieren Sie mit Regex E-Mail-Adressen aus dem Web in Google Sheets.

Um Zapier-Adressen mit Regex '"power" zu erhalten, geben wir den Befehl <span> ein, anstatt nach der Klasse zu suchen. Jetzt führen wir diese Aufgabe in zwei Schritten aus: Rufen Sie Informationen von der Zapier-Seite in die erste Spalte auf und sortieren Sie die E-Mail in die zweite Spalte:

= importxml ("https://zapier.com/about//", "// span")

= Regexextrakt (A1, "[a-zA-Z0-9 _ \. \ + -] + @ [a-zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2, 15} ")

Schließlich haben wir diese Tabelle:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Denken Sie daran, dass ImportXML alle Spalten und Zeilen abhängig von den gefundenen Daten selbst ausfüllt. Die Regex-Abfrage muss in jeder Zelle ausgefüllt werden, in der Sie Ergebnisse erhalten möchten. Um alles zusammenzusetzen, müssen Sie nur den Befehl Regexextract verwenden , bei dem es sich um eine Formel für Array-Konstanten handelt:

= ArrayFormula (IFERROR (REGEXEXTRACT (IMPORTXML ("https://zapier.com/about//", "// span")), "[a-zA-Z0-9 _ \. \ + -] + @ [a- zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2,15} "))))

Und hier ist das Ergebnis:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Hoffe der Artikel ist hilfreich für Sie!

Sign up and earn $1000 a day ⋙

So fügen Sie einen Timer in Google Slides ein

So fügen Sie einen Timer in Google Slides ein

Während einer Google Slide-Präsentation sollten Sie festlegen, wie lange Sie auf einer Folie bleiben oder Ihrem Publikum die Möglichkeit geben, sich an Diskussionen zu beteiligen oder Fragen zu beantworten

OnePlus 5-Test: Das OnePlus 5T ist ohne Preiserhöhung noch besser

OnePlus 5-Test: Das OnePlus 5T ist ohne Preiserhöhung noch besser

Das OnePlus 5 war eines der besten Telefone des Jahres 2017. Dann kam das OnePlus 5T und verbesserte es in einer Reihe bescheidener, aber wichtiger Dinge, ohne etwas hinzuzufügen

So fügen Sie Bargeld in der Cash-App hinzu

So fügen Sie Bargeld in der Cash-App hinzu

Mit der Cash App können Sie Menschen Geld senden, in Unternehmensaktien investieren, mit Kryptowährungen handeln und Ihre Rechnungen bezahlen. Allerdings müssen Sie Ihrem Bargeld Geld hinzufügen

So schneiden Sie eine Form in Illustrator aus

So schneiden Sie eine Form in Illustrator aus

Sie können verschiedene Methoden zum Ausschneiden von Formen in Adobe Illustrator verwenden. Dies liegt daran, dass viele Objekte nicht auf die gleiche Weise erstellt werden. Bedauerlicherweise,

Telegram-YouTube-Downloader

Telegram-YouTube-Downloader

Wenn Sie Videos herunterladen und werbefreie Inhalte auf YouTube genießen möchten, müssen Sie Premium-Abonnent sein. Hier kommen praktische Telegram-Bots ins Spiel.

So beheben Sie, dass Outlook keine E-Mails sendet

So beheben Sie, dass Outlook keine E-Mails sendet

Wenn Sie in Outlook eine E-Mail senden, erwarten Sie, dass diese sofort zugestellt wird. Allerdings ist Outlook wie andere E-Mail-Plattformen anfällig für Störungen und

So schalten Sie den Touchscreen eines Chromebooks aus

So schalten Sie den Touchscreen eines Chromebooks aus

https://www.youtube.com/watch?v=13ei1TYS8uk Chromebooks sind brillante Geräte, wenn Sie keinen Laptop benötigen, der anspruchsvolle Programme bewältigen kann. Wenn Sie dabei sind

Kann uns die virtuelle Realität jemals so überraschen wie das frühe Kino?

Kann uns die virtuelle Realität jemals so überraschen wie das frühe Kino?

Die Geschichte besagt, dass im Jahr 1896, als die Brüder Lumière zum ersten Mal einen Zug zeigten, der in den Bahnhof La Ciotat einfuhr, das Kinopublikum in Chaos ausbrach.

So erhalten Sie Großaufträge mit DoorDash

So erhalten Sie Großaufträge mit DoorDash

Wenn Sie ein gut verdienender Dasher sein möchten, können Sie nicht einfach die App herunterladen und sofort mit dem Geldverdienen beginnen. Es ist nicht so einfach wie Lieferungen durchzuführen.

Sonys Roboterhund aus den 90ern ist zurück und treuer als je zuvor

Sonys Roboterhund aus den 90ern ist zurück und treuer als je zuvor

Als ich ein Kind war, habe ich meine Eltern wegen eines Welpen belästigt, bis sie nachgaben und mir zu Weihnachten einen schenkten. Na ja, zumindest ein Roboter. Es war Sonys Aibo. Der

So deaktivieren Sie Live-Fotos auf einem iPad

So deaktivieren Sie Live-Fotos auf einem iPad

Ein Live-Foto besteht aus einigen Sekunden Ton und Video, die vor und nach der Aufnahme eines Bildes aufgezeichnet werden. Diese Videos nehmen mehr Platz ein als Standbilder, was sie verschlingt

So finden Sie Ihren Microsoft Office-Produktschlüssel

So finden Sie Ihren Microsoft Office-Produktschlüssel

Schnelle Antwort: Führen Sie die Eingabeaufforderung als Administrator aus. Geben Sie Folgendes ein: cscript C:Programme (x86)Microsoft OfficeOffice16OSPP.vbs /dstatus und

Warum bekomme ich in Lyft nicht mehr Fahrten?

Warum bekomme ich in Lyft nicht mehr Fahrten?

Sie sind Lyft-Fahrer geworden und bereit, auf die Straße zu gehen und Geld zu verdienen. Sie warten auf Ihre erste Abholung, erhalten aber keine Mitfahranfragen

MeWe Vs. Facebook

MeWe Vs. Facebook

Was suchen Sie in einer Social-Networking-Plattform? Möchten Sie Sicherheit, Funktionalität, Anpassungsoptionen und eine sichere Möglichkeit zum Senden von Nachrichten?

Arten von Fire-Tablet-Ladegeräten – Eine Kurzanleitung

Arten von Fire-Tablet-Ladegeräten – Eine Kurzanleitung

Die Fire-Tablets von Amazon gehören mittlerweile zu den beliebtesten Mobilgeräten auf dem Markt. Obwohl Amazon mit einem Tablet begann, war das im Grunde ein

Welcher Amazon Fire Stick ist der neueste? [Mai 2023]

Welcher Amazon Fire Stick ist der neueste? [Mai 2023]

Amazons Vorstoß in die große Welt der Media-Streaming-Geräte wurde allgemein gut aufgenommen. Der erschwingliche Preis des Fire TV, zusammen mit Amazons

Warum ist meine Nummer im Telegram gesperrt?

Warum ist meine Nummer im Telegram gesperrt?

Haben Sie jemals die Benachrichtigung „Diese Telefonnummer ist gesperrt“ in Telegram erhalten? Wenn ja, fragen Sie sich vielleicht, was das bedeutet. Telegram hat Einschränkungen

So führen Sie PowerPoint-Dateien zu einer einzigen Datei zusammen

So führen Sie PowerPoint-Dateien zu einer einzigen Datei zusammen

https://www.youtube.com/watch?v=isTnCfYDxs4 PowerPoint-Präsentationen sind in vielen Arbeitsbereichen alltäglich, und oft besteht die Notwendigkeit, sie zu kombinieren

So führen Sie Code im Terminal in VS-Code aus

So führen Sie Code im Terminal in VS-Code aus

Das VS Code-Terminal (Visual Studio Code) ermöglicht Textbefehle. Die Ergebnisse und Ausgaben können im Editor angezeigt werden und er unterstützt Shells wie Bash,

So kündigen Sie Ihr Paramount Plus-Abonnement

So kündigen Sie Ihr Paramount Plus-Abonnement

Sie können ein Paramount Plus-Abonnement nur auf derselben Plattform kündigen, bei der Sie das Abonnement abgeschlossen haben. Die einfachste Methode ist zwar die Paramount Plus-Website