Kickoff und Initialer Sprint
Kickoff
Datum: 11.10.2018
Erläuterung des Projektumfelds
Projektrollen und -steuerung
Tools und Services
Initialer Sprint
Nutzen
Der Sprint soll die Funktion der numb3rspipeline unter Realbedingungen des Projekts testen.
Die Teammitglieder sollen mit der beschriebenen Vorgehensweise vertraut werden.
Probleme im Zusammenspiel zwischen Team und numb3rspipeline sowie Verbesserungen sollen identifiziert werden.
Ziel
Bis zum 18.10.2018 analysiert jedes Teammitglied mind. 3 IoT Infografiken.
Umgang mit Dropbox
Die Dropbox Freigabe ist schwierig. Ursprünglich war geplant, dass jedes Teammitglied einen Folder über Dropbox freigegeben bekommt. Darüber wird mit der numb3rspipeline interagiert. Es kann jedoch kein Folder unterhalb des Apps Folders zum gemeinsamen Austausch freigegeben werden. Der Apps Folder wurde vom Dropbox API angelegt. Die File Interaktionen via des Dropbox API sind auf diesen Folder beschränkt. Eine weitere Konsequenz ist, dass man keinen Subfolder des Apps Folder für gemeinsamen Arbeiten mit anderen Dropbox Nutzern freigeben kann. Daher folgendes Vorgehen:
Funktion "Dateien anfordern": Dropbox erstellt einen Link über den Dateien in entsprechenden Folder von Users gelegt werden können. Hierbei können Folder unterhalb des Apps Folders angegeben werden. Das ist der Upload-Link.
Funktion "Ordner freigeben": Dropbox erstellt einen Link, der ansehen und runterladen erlaubt. Das ist der Download-Link.
Vorgehen im Sprint
IoT Infografiken mit Google Bildersuche finden
URLs der Bilddateien speichern in Datei
url_list.txt
[DROPBOX, Upload-Link]
url_list.txt
auf Dropbox kopieren. Link zum Hochladen in separater Mail erhalten.... numb3rspipeline läuft... nichts zu tun, warten.
[DROPBOX, Download-Link] Ein neues Verzeichnis in dem Format
[yyyymmdd-hhmm]
wurde angelegt. Für jede URL ausurl_list.txt
liegt in diesem Verzeichnis nun eine Bild- und Textdatei. Dateien können über den Download-Link zugegriffen werden.file<n>_<bildname>
file<n>_<bildname>.txt
Keyword-Suche in Textdatei
file<n>_<bildname>.txt
Erfassung der Daten in Ethercalc
Vorlage: https://ethercalc.org/llbkbe1n62vh
Neues ethercalc erstellen: https://ethercalc.org/ --> Create Spreadsheet
Daten aus Bilddatei
file<n>_<bildname>
manuell extrahieren und gemäß Vorlage in neues ethercalc Spreadsheet eintragen
Ethercalc URL kopieren und über Teamleiter gesammelt an C. Decker schicken
Ergebnisse & Lessons learnt
In diesem Sprint sollte die Praxistauglichkeit der numb3rspipeline getestet werden.
numb3rspipeline: Probleme und Lösungen
Beim Hochladen der Datei
url_list.txt
wird der Datei der Username vorangestellt. numb3rspipeline wurde angepasst, und kann nun mit dem veränderten usernamen umgehen.Die URLs enthalten jeweils ein
<CR>
Zeichen am Ende der Zeile. Das verursacht Fehler beim Runterladen der Bilder viacurl
. Das URL parsing wurde angepasst.Leerzeilen in der
url_list.txt
werden als leere URLs interpretiert. Es wird kein File erzeugt, aber der file counter<n>
weitergezählt. Wird nicht behandelt. Verhalten der numb3rspipeline bleibt bestehen.
Empfehlungen ans Team
URLs in
url_list.txt
, die nicht auf einen Filenamen enden, können nicht verarbeitet werden. Wird nicht behandelt. Verhalten der numb3rspipeline bleibt bestehen. Empfehlung: URLs verwenden, die auf Dateinamen enden.Bilder, die aus der Vorschau der Google Bildersuche entnommen werden, haben einen schlechte Qualität für die Texterkennung. Empfehlung: Bild der Originalseite angeben.
URLs, die nicht in einer Datei
url_list.txt
stehen, können nicht verarbeitet werden. Empfehlung: URLs immer nur inurl_list.txt
speichern.
Erzielter Wert
numb3rspipeline kann mit vom Team erstellen url_list.txt
Dateien umgehen.
Nächste Schritte
Folgende Verbesserungen der numb3rspipeline sind vorgesehen.
numb3rspipeline integriert Keyword Suche
automatische Erstellung des ethercalc Spreadsheet durch numb3rspipeline
Last updated