Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Video Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Sie können Daten von jeder Webseite mit der ImportXML-Funktion von Google Sheets importieren. Hier erfahren Sie, wie Sie die ImportXML-Funktion in Google Sheets verwenden.

Wenn Sie die ImportXML-Funktion von Google Sheet beherrschen, haben Sie das Gefühl, bereits einen zertifizierten Blattassistenten zu besitzen. ImportXML erhält Informationen aus jedem XML-Feld. Dank dessen können Sie die darauf generierten Daten und Metadaten überall herunterladen.

Grundlagen von XML und HTML

Die XML-Auszeichnungssprache gibt die Datensätze auf einer Webseite an. Im Wesentlichen befindet sich jeder Satz von <something> und </ something> - den Bausteinen des Web-Quellcodes oder eines bestimmten Datensatzes - in ihnen. Der Quellcode des Webs enthält Text im <p> -Arsatz-Tag - ein Absatz, der manchmal <b> alt enthält - in Fettdruck und möglicherweise <a> einen Link - Link (gefolgt von </ a > </ b>. </ p> </ body> , um das gesamte Tag zu schließen).

Die Google Sheets ImportXML-Funktion kann einen bestimmten XML-Datensatz finden und Daten außerhalb davon kopieren. Wenn wir im obigen Beispiel alle Links auf der Seite erhalten möchten, müssen wir die ImportXML-Funktion bitten, alle Informationen in das <a> </a> -Tag einzugeben . Wenn Sie den gesamten Text eines Webs möchten, können Sie zunächst alles in <body> </ body> oder in jeder Version von <p> </ p> aufnehmen und die Daten zu einem späteren Zeitpunkt löschen.

So extrahieren Sie eine Liste mit Postleitzahl und Landkreis in der Stadt

Die Tabellen in Wikipedia sind großartige ImportXML-Übungen. In diesem Artikel wird beispielsweise die gesamte Postleitzahl in Edmonton, Alberta, heruntergeladen. Suchen Sie eine Liste der kanadischen Postleitzahlen, die mit dem Buchstaben T beginnen. Öffnen Sie diese Seite in einem neuen Browserfenster, um loszulegen.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Wählen Sie eine Postleitzahl aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Überprüfen , um das Browser-Tool zum Anzeigen der Seitenquelle zu öffnen. Sie sehen, dass sich jeder Seitenquellcode in einem Tag befindet (identifizieren Sie eine Zelle in der Tabelle). Danach importiert der Artikel alle darin enthaltenen TD-Tags aus Edmonton.

Erstellen Sie ein neues leeres Google Sheet. Der Artikel übernimmt den gesamten Inhalt des TD-Tags, einschließlich <span> und Link, indem er die Daten angibt, für die Sie die XPath-Syntax verwenden möchten. ImportXML verwendet die URL und das Tag, nach denen Sie suchen, als Argument für den Import in Google Sheets.

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td")

Sie erhalten folgendes Ergebnis:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Wenn Sie zur Seitenquelle zurückkehren, sehen Sie die Postleitzahl in Fettdruck im <b> </ b> -Tag, dem Städtenamen, der auf die Wikipedia-Artikel unter <a> </a> verweist. Versuchen Sie nun, nur Links in jeder großen Stadtbox zu erhalten und andere Links (Nachbarschaften) zu entfernen. Bearbeiten Sie sie in zwei Tastenbefehlen, Spalte A und B:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1]")

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / b [1]")

Sie müssen die Ergebnisse ein wenig verfeinern:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Diese Aktion hilft Ihnen zu verstehen, wie die XPath-Abfragesyntax funktioniert: Ein Tag stellt nur die erste Version von <tag> im <übergeordneten Tag> bereit. Daher gibt Ihnen td / span / a [1] bei jedem <td> den ersten Link in <span>. In ähnlicher Weise gibt Ihnen td / b [1] den ersten fetten Text in jedem <td> oder in diesem Fall nur die Postleitzahl.

Das Tolle ist, dass Sie zwei Abfragen in einer Funktion ausführen können. Daher kombiniert der Artikel zwei Anforderungen mit einem | -Symbol in der Mitte:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1] | // td / b [1]")

Sie erhalten jedoch nicht die gleichen vorherigen Ergebnisse. Es wird die gesamte Anforderung in einer langen Liste anstatt in zwei Spalten abgewechselt. Es hat viele Vorteile, ist aber in diesem Artikel nicht erforderlich.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Auswahl der Postleitzahl in den Feldern mit dem Link "Edmonton". Wir werden diesen Code verwenden:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / b [1]")

Setzen Sie den "Suche" -Text in eckige Klammern, um die Ergebnisse einzugrenzen, ohne die Art und Weise zu beeinflussen, wie Ergebnisse erzielt werden.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Nun zu den Namen der umliegenden Gebiete. Schreiben Sie die entsprechende importXML-Funktion in die nächste Spalte und erhalten Sie den folgenden Text von "Edmonton".

Der Artikel nimmt den gesamten Inhalt des Bereichs [1] und verwendet Klammern und Fadenkreuze, um den Inhalt zu unterteilen, wobei "Edmonton" in die erste Spalte und der Nachbarschaftsname in die folgende Spalte eingefügt werden. Wir können dann die Postleitzahl mit dem entsprechenden Namen kombinieren:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / span [1]")

Verwenden Sie als Nächstes die Funktion Teilen und verketten Sie einige der folgenden Spalten, um die verarbeiteten Daten zu teilen und zu gruppieren:

= SPLIT (verketten (B2: J2), "(/)")

Zum Schluss hier die Ergebnistabelle mit den notwendigen Informationen:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

So kopieren Sie E-Mail-Adressen automatisch aus dem Web

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

In diesem Artikel erfahren Sie, wie Sie die E-Mails aller Mitarbeiter auf der Seite "Info |" abrufen Zapier. Wenn Sie sich den Quellcode ansehen, sehen Sie, dass sich die E-Mail-Adresse jedes Mitglieds im Feld class = "email" befindet. Wenn Sie ein Tag-Attribut angeben möchten, verwenden Sie die Google Sheets ImportXML-Funktion wie folgt:

= importxml ("https://zapier.com/about//", "// span [@ class = 'email']")

So importieren Sie mit Regex E-Mail-Adressen aus dem Web in Google Sheets.

Um Zapier-Adressen mit Regex '"power" zu erhalten, geben wir den Befehl <span> ein, anstatt nach der Klasse zu suchen. Jetzt führen wir diese Aufgabe in zwei Schritten aus: Rufen Sie Informationen von der Zapier-Seite in die erste Spalte auf und sortieren Sie die E-Mail in die zweite Spalte:

= importxml ("https://zapier.com/about//", "// span")

= Regexextrakt (A1, "[a-zA-Z0-9 _ \. \ + -] + @ [a-zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2, 15} ")

Schließlich haben wir diese Tabelle:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Denken Sie daran, dass ImportXML alle Spalten und Zeilen abhängig von den gefundenen Daten selbst ausfüllt. Die Regex-Abfrage muss in jeder Zelle ausgefüllt werden, in der Sie Ergebnisse erhalten möchten. Um alles zusammenzusetzen, müssen Sie nur den Befehl Regexextract verwenden , bei dem es sich um eine Formel für Array-Konstanten handelt:

= ArrayFormula (IFERROR (REGEXEXTRACT (IMPORTXML ("https://zapier.com/about//", "// span")), "[a-zA-Z0-9 _ \. \ + -] + @ [a- zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2,15} "))))

Und hier ist das Ergebnis:

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Hoffe der Artikel ist hilfreich für Sie!

Anweisungen zum Einfügen von Musiknoten in Word

Anweisungen zum Einfügen von Musiknoten in Word

Wenn Sie ein Lied in Word kopieren möchten, aber nicht wissen, wie Sie Notizen hinzufügen sollen. Der folgende Artikel hilft Ihnen dabei mit ein paar kleinen Schritten.

So verwandeln Sie eine Google Sheets-Tabelle in einen farbenfrohen Regenbogen

So verwandeln Sie eine Google Sheets-Tabelle in einen farbenfrohen Regenbogen

Um den International Pride Month zu feiern, können Nutzer mit Google eine trockene, eintönige Tabelle extrem schnell in einen farbenfrohen Regenbogen verwandeln.

So sehen Sie 3D-Tiere: Löwe, Katze, Hund, Pferd, Hai ... bei Google

So sehen Sie 3D-Tiere: Löwe, Katze, Hund, Pferd, Hai ... bei Google

In diesem Artikel erfahren Sie, wie Sie 3D-Bilder von Tieren auf Ihrem Handy über die Google-Suchmaschine anzeigen.

Zusammenfassung der gängigen Tastaturkürzel in Adobe Reader

Zusammenfassung der gängigen Tastaturkürzel in Adobe Reader

Adobe Reader ist eines der besten PDF-Lesetools, die derzeit verfügbar sind und von vielen Benutzern geliebt werden. Unterstützen Sie Benutzer beim einfachen Öffnen, Anzeigen, Bearbeiten, Drucken und Freigeben von PDF-Dokumenten.

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Verwendung der Google Sheets ImportXML-Funktion zum Sammeln von Daten überall

Sie können Daten von jeder Webseite mit der ImportXML-Funktion von Google Sheets importieren. Hier erfahren Sie, wie Sie die ImportXML-Funktion in Google Sheets verwenden.

So verhindern Sie die Selbstreinigung von Schadcode Unikey, Zalo in Vietnam

So verhindern Sie die Selbstreinigung von Schadcode Unikey, Zalo in Vietnam

Das Sicherheitsunternehmen CyRadar (FPT) hat gerade vor einer neuen Art von Malware gewarnt, ähnlich wie sich der WannaCry-Virus verbreitet. Sie nutzen den Fehler des Windows-Betriebssystems (Fehler MS17-010), um sich über das LAN zu verbreiten.

So zeichnen Sie Formen in Sketch

So zeichnen Sie Formen in Sketch

Eine der beliebtesten Ebenen in der Sketch-Software ist Shape. Der folgende Artikel zeigt Ihnen, wie Sie Formen in Sketch einfügen, zeichnen und anpassen.

Verknüpfungen, Befehle und Syntax mit Slack sollten Sie kennen

Verknüpfungen, Befehle und Syntax mit Slack sollten Sie kennen

Mithilfe der folgenden Tastaturkürzel und Tipps zur Verwendung von Slack können Sie effektiver online arbeiten, insbesondere bei Aktivitäten zur Gruppenzusammenarbeit.

Die beste ewige Kalender-App, um den Tag des neuen Jahres zu sehen

Die beste ewige Kalender-App, um den Tag des neuen Jahres zu sehen

Der ewige Kalender ist eine unverzichtbare Anwendung für Ihr Telefon. Ein vertrauenswürdiger Begleiter für ein glückliches und erfolgreiches Jahr!

So erstellen Sie ein Notizbuch mit elementarer Handschrift in Word

So erstellen Sie ein Notizbuch mit elementarer Handschrift in Word

Möchten Sie Ihr eigenes handgeschriebenes Elfen-Notizbuch mit Handschrift entwerfen? Mit nur wenigen Schritten im folgenden Tutorial können Sie mit dem bekannten Word-Dokumentbearbeitungswerkzeug schnell eine schöne Notizbuchvorlage erstellen.

So erstellen Sie transparente Bilder in Microsoft PowerPoint

So erstellen Sie transparente Bilder in Microsoft PowerPoint

Microsoft PowerPoint verfügt über eine kleine Funktion in der Multifunktionsleiste, die Sie möglicherweise nicht bemerken. Sie heißt "Transparente Farbe festlegen". Diese Funktion kann den Hintergrund eines Fotos löschen und in ein transparentes Foto verwandeln.

Anweisungen zum Konvertieren von Zahlen in Wörter in Excel mit VnTools

Anweisungen zum Konvertieren von Zahlen in Wörter in Excel mit VnTools

Ihre Arbeit bezieht sich oft auf Zahlen oder speziell auf Währung oder Gehaltsabrechnung. Berechnen Sie die Einnahmen und Ausgaben. Die automatische Zahlenumrechnung ist äußerst hilfreich und spart Zeit. sowie Fehler im Prozess minimieren

Aktivieren Sie den Vollbildmodus, wenn Sie PDF-Dateien mit Foxit Reader lesen

Aktivieren Sie den Vollbildmodus, wenn Sie PDF-Dateien mit Foxit Reader lesen

Wenn Sie den Vollbildmodus in Foxit Reader anzeigen möchten, drücken Sie die Taste F11. Wenn Sie diesen Modus verlassen möchten, drücken Sie erneut die Taste F11. Dieser Ansatz scheint jedoch etwas unpraktisch zu sein, da Ihre Arbeit häufig Dokumente in Foxit Reader liest. Also ja

Paint.NET - kostenlose Fotobearbeitungssoftware, die auf dem Computer wirksam ist

Paint.NET - kostenlose Fotobearbeitungssoftware, die auf dem Computer wirksam ist

Die Stärke von Paint.NET liegt in den Werkzeugen zum Korrigieren und Löschen von Bildfarben. Daher wird Paint.NET häufig für die Porträtfotografie bevorzugt, die auch als Selfie, Selfie ...

Anweisungen zum Trennen von negativen und positiven Zahlen in Microsoft Excel

Anweisungen zum Trennen von negativen und positiven Zahlen in Microsoft Excel

Die Trennung von negativen und positiven Zahlen ist für Büroangestellte äußerst wichtig. Der folgende Artikel hilft den Menschen dabei, dies einfach zu tun.

Microsoft Office - So legen Sie die Standardschriftart in Word fest

Microsoft Office - So legen Sie die Standardschriftart in Word fest

Durch das Festlegen der Standardschriftart in Word sparen Sie viel Zeit und können bei der Textbearbeitung keine Anzeigeprobleme feststellen.

12 kostenlose Keynote-Vorlagen mit Präsentationen

12 kostenlose Keynote-Vorlagen mit Präsentationen

Wenn Sie Apples Keynote als Präsentation verwenden, verwenden Sie am besten vorhandene Vorlagen, um überzeugende und beeindruckende Inhalte für alle Themen aus den Bereichen Wirtschaft, Gesundheit, Bildung ... zu präsentieren Einige vorgeschlagene Vorlagen für Folienpräsentationen sind besser als Keynote

Anweisungen zum Erstellen von Tabellen in Adobe Illustrator

Anweisungen zum Erstellen von Tabellen in Adobe Illustrator

Adobe Illustrator ist das beste Grafikdesign-Tool für Profis und Amateure. Mit nur wenigen einfachen Schritten können Sie schnell eine Tabelle in Ihren Adobe Illustrator-Designs erstellen.

So ermitteln Sie ungerade und gerade Zahlen in Excel

So ermitteln Sie ungerade und gerade Zahlen in Excel

Das Ermitteln von geraden und ungeraden Zahlen ist eine der regulären Aufgaben der Buchhaltungsbranche. Der folgende Artikel enthält Anleitungen zum Ermitteln von ungeraden und geraden Zahlen in Excel.

Anweisungen zum Einfügen des Kontrollkästchens in Google Sheets

Anweisungen zum Einfügen des Kontrollkästchens in Google Sheets

Der folgende Artikel zeigt Ihnen, wie Sie Kontrollkästchen in eine Zelle in Google Sheets (Google Sheets) einfügen.