Αρχειοθέτηση και Ανάκτηση Πληροφοριών στο Διαδίκτυο

Το εργαστήριο αυτό παρουσιάζει στους/στις συμμετέχοντες/ουσες μεθόδους, εργαλεία και συμβουλές για την ανεύρεση και ανάκτηση ιστορικού και «χαμένης» πληροφορίας από ιστότοπους, αλλά και για την αρχειοθέτηση και διατήρηση αντιγράφων από ιστοσελίδες έτσι ώστε να είναι σε θέση να αποδείξουν ότι κάτι έχει υπάρξει στο διαδίκτυο.

Επισκόπηση του εργαστηρίου

Θέμα: Αρχειοθέτηση και Ανάκτηση Πληροφοριών στο Διαδίκτυο: Μέθοδοι, συμβουλές και εργαλεία

Στόχοι

  • Παρουσίαση πρακτικών, μεθόδων και εργαλείων για την εύρεση και ανάκτηση «χαμένης» πληροφορίας από ιστοσελίδες.
  • Παρουσίαση μεθόδων και εργαλείων αρχειοθέτησης και διάσωσης αντιγράφων ιστοσελίδων για μελλοντική χρήση.
  • Ανάδειξη της σημασίας των διαδικτυακών αρχείων και της αρχειοθέτησης ψηφιακού περιεχομένου, αλλά και της σημασίας του να παρέχει κανείς αποδείξεις ότι κάτι έχει υπάρξει στο διαδίκτυο.

Μαθησιακά αποτελέσματα

  • Οι συμμετέχοντες/ουσες θα είναι σε θέση να εφαρμόσουν μεθόδους εύρεσης και ανάκτησης ιστορικού και «χαμένης» πληροφορίας από ιστοσελίδες.
  • Οι συμμετέχοντες/ουσες θα είναι σε θέση να αρχειοθετήσουν και να διασώσουν αντίγραφα ιστοσελίδων για μελλοντική χρήση.

Κατευθυντήριες γραμμές για τους/τις εκπαιδευτές/τριες:

  • Το εργαστήριο μπορεί να χωριστεί σε ενότητες διάρκειας 30-40 λεπτών. Τα διαλείμματα δεν περιλαμβάνονται στο χρονοδιάγραμμα: μπορείτε να αποφασίσετε πώς θα τα μοιράσετε, αναλόγως των συνθηκών. Μεταξύ των ενοτήτων, μπορεί να προστεθεί ένα μικρό διάλειμμα ή μια σύντομη δραστηριότητα τόνωσης ('energizer').
  • Για τις ομαδικές δραστηριότητες, χωρίστε τους συμμετέχοντες/ουσες σε ομάδες των 3-5 ατόμων. Προσαρμόστε το πρόγραμμα κατάλληλα, ανάλογα με τον αριθμό των συμμετεχόντων και το μέγεθος των ομάδων, έτσι ώστε να μείνει χρόνος για feedback ή για να συζητήσετε με τους εκπαιδευόμενους την εμπειρία τους από τις ασκήσεις. Μπορείτε, επίσης, να ενθαρρύνετε τους/τις συμμετέχοντες/ουσες να αποφασίσουν τι ρόλο θα έχει ο καθένας στις ομαδικές δραστηριότητες. Οι ρόλοι μπορεί να περιλαμβάνουν: ένα άτομο που συντονίζει, ένα που καταγράφει/σημειώνει, ένα που χρονομετρά, ένα που παρουσιάζει κι ένα που αναλαμβάνει την οπτική παρουσίαση (εφόσον απαιτείται).
  • Για τα διαδικτυακά εργαστήρια, συνιστούμε να έχετε ένα κοινό χρονόμετρο στην οθόνη όσο διαρκούν οι ομαδικές δραστηριότητες ή τα "energizers".
  • Όπου είναι δυνατό, προσαρμόστε τα παραδείγματα ανάλογα με το δικό σας κοινό.

Τρόπος διεξαγωγής: διαδικτυακά / δια ζώσης

Διάρκεια του εργαστηρίου (χωρίς διαλείμματα): 2 ώρες και 40 λεπτά

Αριθμός συμμετεχόντων/ουσών: από 6 έως 24

Εργαλεία

Για τα διαδικτυακά εργαστήρια:

  • Πλατφόρμα τηλεδιάσκεψης της αρεσκείας σας
  • Διαδικτυακές εφαρμογές για δημοσκοπήσεις και κουίζ (π.χ. Slido, Mentimeter, κ.α.)
  • Εφαρμογές με διαδραστικούς πίνακες, (όπως το Mural, το Miro, κ.α.)

Για τα διά ζώσης εργαστήρια:

  • Έναν υπολογιστή ανά συμμετέχοντα ή ομάδα
  • Έναν λευκοπίνακα
  • Ένα μπλοκ σεμιναρίων
  • Μαρκαδόρους
  • Χαρτάκια σημειώσεων (post-it)

Σχετικός οδηγός:

Υλικά προετοιμασίας του εργαστηρίου για κατέβασμα:

Δραστηριότητες μάθησης

Άνοιγμα (10 λεπτά)

Εισαγωγή στο εργαστήριο

Διαβάστε Παρακολουθήστε Ακούστε | 5 λεπτά

Οδηγίες

  • Τραβήξτε την προσοχή θέτοντας μια ερώτηση ή σχολιάζοντας ένα σχετικό θέμα, μια εικόνα κ.λπ.

  • Παρουσιάστε τον εαυτό σας και τους στόχους του εργαστηρίου.

  • Προαιρετικά: Παρουσιάστε την πηγή του υλικού που θα διδαχθεί (Tactical Tech).

  • Ενημερώστε τους/τις συμμετέχοντες/ουσες για το πρόγραμμα του εργαστηρίου.

  • Προτείνετε βασικούς κανόνες για το εργαστήριο: πώς συμπεριφερόμαστε και πώς αντιδρούμε, σεβασμός προς τους άλλους κ.λπ. Στην περίπτωση που πραγματοποιήσετε μία εκτενέστερη εκδοχή του εργαστηρίου, μπορείτε επίσης να δουλέψετε πάνω σε μία Κοινή Συμφωνία ή σε έναν από κοινού συμφωνηθέντα Κώδικα Ηθικής (μπορείτε να ανατρέξετε στο «Αποκαλύπτοντας το Αόρατο: Οδηγός Συντονιστή»).

Παρουσίαση συμμετεχόντων/ουσών / Σπάμε τον πάγο

Παραγωγή | 10 λεπτά

Οδηγίες

  • Ξεκινήστε με έναν σύντομο γύρο γνωριμίας ζητώντας από τα άτομα που συμμετέχουν να απαντήσουν σε μερικές ερωτήσεις για τον εαυτό τους, τη δουλειά τους, τις προσδοκίες τους σχετικά με το εργαστήριο κ.λπ.

  • Εναλλακτικά, μπορείτε να επιλέξετε μια άσκηση για να σπάσετε τον πάγο, ώστε να ενθαρρύνετε την ομάδα να κάνει κάτι δημιουργικό. Να σχεδιάσει απαντήσεις ή ιδέες σε έναν πίνακα online. Αν είναι δια ζώσης το εργαστήριο, να σηκωθούν και να κάνουν κάποιες ενέργειες. Δείτε περισσότερα στην ενότητα «Σπάμε τον πάγο» στο «Αποκαλύπτοντας το Αόρατο: Οδηγός Συντονιστή».

Εισαγωγή στα Διαδικτυακά Αρχεία (20 λεπτά)

Παρουσίαση: Γιατί είναι σημαντική η αρχειοθέτηση

Διαβάστε Παρακολουθήστε Ακούστε | 5 λεπτά

Οδηγίες

  • Ξεκινήστε με μία σύντομη παρουσίαση γύρω από την αναγκαιότητα ύπαρξης τεχνικών και εργαλείων για την αρχειοθέτηση του διαδικτύου. Μπορείτε να προσκαλέσετε τους/τις συμμετέχοντες/ουσες να σκεφτούν κάποια σχετικά παραδείγματα όσο μιλάτε.

Πιθανά σενάρια:

  • Κάποιες φορές, όταν θες να επιβεβαιώσεις μία πληροφορία στο διαδίκτυο, μπορεί να βρεθείς ενώπιον συνδέσμων που δεν λειτουργούν ή ιστοσελίδων που δεν είναι πλέον διαθέσιμες.

  • Άλλες φορές, μπορεί να συναντήσεις ιστοσελίδες με εξαιρετικά σημαντικές πληροφορίες που ενδεχομένως να πρόσθεταν μεγάλη αξία στο θέμα σου, αλλά δεν είσαι σε θέση να συνειδητοποιήσεις την αξία τους εκείνη τη στιγμή.

  • Όταν επισκέπτεσαι ξανά μία ιστοσελίδα για να την προσθέσεις στο θέμα σου, μπορεί να συνειδητοποιήσεις ότι αυτή πλέον δεν λειτουργεί, ότι η συγκεκριμένη ιστοσελίδα έχει αφαιρεθεί ή ότι η πληροφορία που χρειάζεσαι δεν είναι πλέον προσβάσιμη και ότι πρέπει να αντικατασταθεί με νέο περιεχόμενο.

  • Κατά πάσα πιθανότητα, θα αντιμετωπίσεις όλες αυτές τις προκλήσεις σε κάποιο σημείο της έρευνάς σου.

Υπόθεση εργασίας: «Χαμένες» σελίδες

Διαβάστε Παρακολουθήστε Ακούστε | 5 λεπτά

Οδηγίες

  • Παρουσιάστε μία περίπτωση κατά την οποία χρήσιμες δημόσιες πληροφορίες έχουν αφαιρεθεί από κάποια ιστοσελίδα και οι οποίες θα μπορούσαν να ανακτηθούν με τη χρήση online εργαλείων όπως το Wayback Machine ή το Archive Today

Προτεινόμενη περίπτωση και σενάριο (μπορείς να βρεις σε αυτόν τον οδηγό: «Αρχειοθέτηση και Ανάκτηση Πληροφοριών στο Διαδίκτυο» "Retrieving and Archiving Information from Websites"):

  • Για παράδειγμα, υπάρχει η περίπτωση του Facebook το οποίο αφαίρεσε τις ιστοσελίδες που εξηγούσαν πώς η πλατφόρμα αξιοποιήθηκε από πολιτικούς παράγοντες και κινήματα για να απευθυνθούν στις μάζες και να τις επηρεάσουν κατά τη διάρκεια εκστρατειών και εκλογικών αναμετρήσεων.

  • Αυτή η σελίδα ήταν διαθέσιμη εδώ: https://www.facebook.com/business/success/categories/government-politics. Ο σύνδεσμός λειτουργούσε, μέχρι που σταμάτησε να λειτουργεί.

  • Το Facebook αφαίρεσε την εν λόγω σελίδα από τη λίστα των “success stories” στις αρχές του 2018, όταν ξέσπασετο σκάνδαλο για την Cambridge Analytica και είχε ως αποτέλεσμα να επιβληθεί ένας εξονυχιστικός έλεγχος στις πρακτικές της εταιρείας, η οποία επέτρεπε σε εξωτερικούς συνεργάτες να έχουν πρόσβαση στη βάση δεδομένων των χρηστών της για εμπορικούς και πολιτικούς λόγους. Με τη βοήθεια του Αρχείου του Διαδικτύου Wayback Machine, μπορεί πλέον να βρει κανείς μία αρχειοθετημένη λίστα με τα πολιτικά πρότζεκτ του Facebook που κάποτε υπήρχαν στην ανενεργή -πλέον- ενότητα “Government and Politics”, στη σελίδα “Success Stories” (https://www.facebook.com/business/success).

  • Μια αναζήτηση του συνδέσμου "https://www.facebook.com/business/success/categories/government-politics" στο Wayback Machine αποκαλύπτει ότι αυτά τα παραδείγματα ήταν δημοσιευμένα στην ενότητα "Government and Politics" μέχρι το 2017, όπως αποθηκεύτηκαν στο Internet Archive εδώ.

ΥΛΙΚΑ:

Η χρησιμότητα των εργαλείων αρχειοθέτησης του διαδικτύου

Συζήτηση | 10 λεπτά

Οδηγίες

  • Χωρίστε τους/τις συμμετέχοντες/ουσες σε μικρές ομάδες των 3-5 ατόμων και προσκαλέστε τους να συζητήσουν:

      1. Πώς τα εργαλεία και οι υπηρεσίες αρχειοθέτησης του διαδικτύου μπορούν να φανούν χρήσιμα στη δουλειά τους και
      1. Ποιες είναι περιπτώσεις στις οποίες θα μπορούσαν να χρησιμοποιηθούν.
  • Προτείνετε σε κάθε ομάδα να ορίσει κάποιον/κάποια που θα κρατάει σημειώσεις.

  • Καταγράψτε τα βασικά επιχειρήματα σε έναν online λευκοπίνακα (αν το εργαστήριο γίνεται διαδικτυακά) ή σε ένα μπλοκ σεμιναρίων (αν το εργαστήριο γίνεται διά ζώσης).

Αναζήτηση και Ανάκτηση Περιεχομένου από τα Αρχεία του Διαδικτύου (50 λεπτά)

Αρχεία του Διαδικτύου: αναζήτηση και ανάκτηση

Διαβάστε Παρακολουθήστε Ακούστε | 15 λεπτά

Οδηγίες

Κάντε μία σύντομη παρουσίαση των βασικών εργαλείων/πλατφορμών αρχειοθέτησης του Διαδικτύου, τα οποία μπορούν να χρησιμοποιηθούν για την εύρεση και ανάκτηση παλαιότερων εκδοχών ιστοσελίδων και άλλου online περιεχομένου:

  • Wayback Machine
  • Archive Today

Wayback Machine: https://web.archive.org/

Σημεία στα οποία πρέπει να σταθείτε:

  • Τι είναι το Wayback Machine; Κάντε μία σύντομη εισαγωγή για το Internet Archive, τον οργανισμό πίσω από το εργαλείο, και την [αποστολή] του (https://archive.org/about/).

  • Κάντε μία σύντομη αναφορά στις δύο βασικές λειτουργίες του Wayback Machine:

    1. οι χρήστες μπορούν να αναζητήσουν και να ανακτήσουν ιστορικό περιεχόμενο ιστοσελίδων,
    2. οι χρήστες μπορούν χειροκίνητα να αρχειοθετήσουν ιστοσελίδες στο Wayback Machine (περισσότερες λεπτομέρειες για το πώς αποθηκεύουμε ιστοσελίδες στην επόμενη ενότητα).
  • Κάντε μία επίδειξη -κατά προτίμηση κάνοντας χρήση του Internet- για το πώς αναζητούμε και ανακτούμε τη χρονική αλληλουχία παλαιότερων εκδοχών ιστότοπων/ιστοσελίδων στο Wayback Machine.

  • Εξηγήστε τι συμβολίζουν οι έγχρωμες κουκίδες όταν βλέπουμε ένα ημερολόγιο ή ένα χρονολόγιο αρχειοθετημένων διαδικτυακών αποτελεσμάτων (για παράδειγμα οι πράσινες και μπλε κουκίδες σχετίζονται με τις επιτυχημένες αυτοματοποιημένες προσπάθειες αρχειοθέτησης και τη διαθεσιμότητα του αρχειοθετημένου υλικού. Αντιθέτως, οι κόκκινες κουκίδες υποδεικνύουν μία ανεπιτυχή προσπάθεια αρχειοθέτησης).

  • Εξηγήστε το τεχνικό σκέλος μίας αναζήτησης και αρχειοθέτησης στο Wayback Machine, κάνοντας αναφορά:

    • στους αυτόματους crawlers που χρησιμοποιεί το εργαλείο για να αποφασίσει ποιους ιστότοπους και ιστοσελίδες να επισκεφθεί και να αποθηκεύσει και με τι συχνότητα (δες περισσότερες τεχνικές λεπτομέρειες εδώ και εδώ),
    • σε περιορισμούς που μπορεί να προσκρούει (π.χ. δεν αποθηκεύει πλήρως ιστοσελίδες που περιλαμβάνουν διαδραστικά στοιχεία και κινούμενες εικόνες, ιδιοκτήτες ιστότοπων μπορούν να ζητήσουν να «κατέβει» περιεχόμενο κ.λπ. Δες περισσότερα στο «Αποκαλύπτοντας το Αόρατο: Οδηγός Αρχειοθέτησης», στην ενότητα «Περιορισμοί του Wayback Machine» εδώ).
  • Με αυτή την ευκαιρία, μπορείτε να αναφέρετε και να περιγράψετε όρους, όπως το "robots.txt" και το "Sitemap.xml" και πώς αυτά μπορούν να φανούν χρήσιμα σε ερευνητές. Μιλήστε για το πώς το robots.txt είναι ένα αρχείο που καταγράφει ποια τμήματα ενός ιστότοπου είναι προσβάσιμα από τους crawlers και ποια όχι. Δείτε ένα παράδειγμα εδώ.

  • Ενημερώστε τους/τις συμμετέχοντες/ουσες ότι οι χρήστες μπορούν να δημιουργήσουν και να χρησιμοποιήσουν έναν δωρεάν λογαριασμό στο Internet Archive και στο Wayback Machine, ο οποίος θα τους προσφέρει συγκεκριμένα πλεονεκτήματα όταν αποθηκεύουν ιστοσελίδες (περισσότερες λεπτομέρειες στην επόμενη ενότητα).

  • Τονίστε ότι η ανάκτηση αποθηκευμένων ιστορικών δεδομένων ιστοσελίδων και η αρχειοθέτηση ιστοσελίδων με το Wayback Machine μπορεί να βοηθήσει μια έρευνα και να παρέχει έναν εύκολο τρόπο παρουσίασης των αναφορών της έρευνας και τη σύνδεση με ιστορικό περιεχόμενο. - Επιστήστε την προσοχή στους/στις συμμετέχοντες/ουσες ότι σε κάθε περίπτωση θα πρέπει να κατεβάζουν και να αποθηκεύουν τέτοιου είδους αποδεικτικά στοιχεία σε πολλά σημεία, καθώς υπάρχει πάντα ο κίνδυνος να αφαιρεθεί αρχειοθετημένο υλικό αν οι ενστάσεις ενός ιδιοκτήτη ιστοσελίδας/ιστότοπου θεωρηθούν εύλογα από το Internet Archive.

  • Υπογραμμίστε ότι η χρήση των δωρεάν υπηρεσιών του Internet Archive και του Wayback Machine μπορούν να προσδώσουν στοιχεία ουδετερότητας και αξιοπιστίας σε δημοσιογραφικές έρευνες, καθώς πρόκειται για μία ανεξάρτητη και ευηπόληπτη παγκόσμια πλατφόρμα της οποίας ο στόχος είναι να διασώσει τις πληροφορίες που βρίσκονται στο internet.

Archive Today: https://archive.ph/

Σημεία στα οποία πρέπει να αναφερθείτε:

  • Το Archive Today χρησιμοποιεί διαφορετικό μηχανισμό από το Wayback Machine για να καταγράψει στιγμιότυπα οθόνης από ιστοσελίδες. Αρχειοθετεί κατόπιν αιτήματος ενός χρήστη, δηλαδή μόνο χειροκίνητα.

  • Στέλνει στον ιστότοπο τη διεύθυνση IP του χρήστη, προκειμένου το αρχειοθετημένο υλικό να είναι σχετικό με την περιοχή εκείνου που αρχειοθετεί. Δεν αποθηκεύει, ωστόσο, πληροφορίες για τον τελευταίο.

  • Είναι καλύτερο στο να αποθηκεύει δημόσιες σελίδες σε social media επειδή δεν λαμβάνει υπόψη το robots.txt (π.χ. περιορισμούς που υποδεικνύονται από τους ιδιοκτήτες ιστοσελίδων όσον αφορά την αποθήκευση).

  • Δείξε -ιδανικά χρησιμοποιώντας το ίντερνετ- πώς αναζητούμε και ανακτούμε παλαιότερες εκδοχές ιστοσελίδων που έχουν αποθηκευτεί από χρήστες του Archive Today (χρήσιμες συμβουλές εδώ).

ΥΛΙΚΑ:

Δραστηριότητα: Μηχανή του χρόνου

Ομαδική δραστηριότητα | 10 λεπτά

Οδηγίες

  • Χωρίστε τους/τις συμμετέχοντες/ουσες σε μικρές ομάδες των 3-5 ατόμων. Δώστε σε κάθε ομάδα έναν οδηγό (βλ. υπόδειγμα στην ενότητα «ΥΛΙΚΑ») με τα βήματα που πρέπει να ακολουθήσουν για να αναζητήσουν έναν ιστότοπο ή μια ιστοσελίδα στο Wayback Machine.

  • Θα χρειαστεί να πάνε πίσω στον χρόνο για να βρουν την πλήρη ιστορική καταγραφή ενός ή περισσότερων ιστοσελίδων.

  • Ένα παράδειγμα θα μπορούσε να είναι:

  • Μπορείτε να αντικαταστήσετε αυτό το παράδειγμα με άλλα παραδείγματα εφόσον τα ιστορικά δεδομένα ενός επιλεγμένου χρονικού εύρους είναι διαθέσιμα στο Wayback Machine.

ΥΛΙΚΑ:

Συμβουλές για αναζητήσεις στο Wayback Machine

Διαβάστε Παρακολουθήστε Ακούστε | 10 λεπτά

Οδηγίες

Προετοιμάστε μια σύντομη παρουσίαση που θα περιλαμβάνει:

Συμβουλές για ανάκτηση αρχειοθετημένων ιστοσελίδων από έναν browser:

  • Το Wayback Machine δίνει επίσης τη δυνατότητα να αιτηθείς αρχειοθετημένων εκδοχών ιστότοπων/ιστοσελίδων χωρίς να χρησιμοποιήσεις το interface της μηχανής αναζήτησης του εν λόγω ιστότοπου.

  • Εναλλακτικά, μπορείτε να το κάνετε από το δικό σας browser χρησιμοποιώντας διάφορες διευθύνσεις, εφόσον είναι σωστά διατυπωμένες. Για παράδειγμα:

    • https://web.archive.org/*www.yoursite.com/* (όπου το www.yoursite.com/ μπορεί να είναι οποιοσδήποτε ιστότοπος θέλετε να αναζητήσετε). Ο browser θα εμφανίσει την τελευταία αρχειοθετημένη εκδοχή του ιστότοπου.

    • Διαχωρίστε τις δύο διευθύνσεις με έναν αστερίσκο (*) για να δειτε το ημερολόγιο αρχειοθέτησης του ιστότοπου: https://web.archive.org/*/www.yoursite.com/

    • Προσθέστε έναν αστερίσκο στο τέλος: https://web.archive.org/*/www.yoursite.com/* για να έχετε πρόσβαση σε όλα τα διαθέσιμα αρχεία που υπάγονται σε αυτό το domain, και όχι για να δείτε μόνο την αρχική. Για παράδειγμα, με αυτή την αναζήτηση https://web.archive.org/web/*/cambridgeanalytica.org/* θα εμφανιστεί μία λίστα με όλες τις σελίδες του cambridgeanalytica.org που έχουν αρχειοθετηθεί από το Wayback Machine.

Συμβουλές για τα αρχεία robots.txt:

  • Δώστε έμφαση στη σημασία των αρχείων robots.txt σε ό,τι έχει να κάνει με την αρχειοθέτηση και την έρευνα.

  • Υπενθυμίστε στους/στις συμμετέχοντες/ουσες ότι το robots.txt είναι ένα αρχείο που βρίσκεται σε έναν ιστότοπο, το οποίο καταγράφει τόσο τα κομμάτια του ιστότοπου που είναι προσβάσιμα από crawlers όσο κι αυτά που δεν είναι. Μπορείτε να δειτε αν ένας ιστότοπος περιλαμβάνει αρχείο robots.txt, προσθέτοντας την κατάληξη "/robots.txt" στο domain ή στο subdomain του. Για παράδειγμα: https://www.google.com/robots.txt

  • Οι ιστότοποι μπορούν να χρησιμοποιήσουν αυτό το αρχείο προκειμένου να μπλοκάρουν crawlers από το Wayback Machine, από μηχανές αναζήτησης όπως της Google, ή από οποιαδήποτε άλλη υπηρεσία αρχειοθέτησης. Παρακάτω θα βρείτε μερικούς από τους λόγους για τους οποίους κάποιοι διαχειριστές ιστότοπων χρησιμοποιούν περιοριστικά αρχεία robots.txt:

    • για να περιορίσουν τα κόστη των ευρυζωνικών συνδέσεων,

    • για να αποφύγουν την υπερφόρτωση των servers τους,

    • για να προστατεύσουν τα δικαιώματα των φωτογραφιών τους,

    • για να μην εμφανίζονται στις μηχανές αναζήτησης ιστότοποι των οποίων η κατασκευή δεν έχει ακόμα ολοκληρωθεί,

    • για να κρύψουν δυνάμει ευαίσθητο περιεχόμενο.

  • Ενώ το Wayback Machine δεν συμμορφώνεται πάντα με αυτούς τους περιορισμούς, υπάρχουν crawlers που αρνούνται να αρχειοθετήσουν πολλούς ιστότοπους ακολουθώντας τις οδηγίες των αρχείων robots.txt. Αυτός είναι μεταξύ άλλων, ένας από τους λόγους που οι χρήστες πιθανώς να μην βρίσκουν αρχεία ορισμένων ιστοσελίδων, ή που μπορεί να αντιμετωπίζουν περιορισμούς όταν αρχειοθετούν χειροκίνητα κάποιες ιστοσελίδες.

  • Αν οι χρήστες του Wayback Machine δυσκολεύονται να δουν ή να αρχειοθετήσουν κάποιες αλλά όχι όλες τις σελίδες ενός ιστότοπου, μπορούν να ελέγξουν το σχετικό αρχείο robots.txt για να δουν αν κάποια στοιχεία του site υπόκεινται σε περιορισμούς.

Δραστηριότητα: χρονολόγιο εξέλιξης

Παραγωγή | 15 λεπτά

Οδηγίες

[10 λεπτά] Δημιουργία χρονολογίου

  • Χωρίστε τους/τις συμμετέχοντες/ουσες σε μικρές ομάδες των 3-5 ατόμων προτείνοντας σε κάθε ομάδα να αναθέσει σε κάποιον/κάποια να κρατά σημειώσεις και σε κάποιον/κάποια να παρουσιάσει τα αποτελέσματα της ομαδικής τους δουλειάς.

  • Ζητήστε από τις ομάδες να επιλέξουν έναν ιστότοπο που ξέρουν καλά (ή που είναι σχετικός με τη δουλειά τους) και να δημιουργήσουν ένα χρονολόγιο με στιγμιότυπα οθόνης (screenshots) που να δείχνουν την εξέλιξη ενός ιστότοπου στην πάροδο του χρόνου.

  • Το χρονολόγιο θα πρέπει να περιλαμβάνει τουλάχιστον 4-5 screenshots.

  • Στη συνέχεια, κάθε ομάδα θα πρέπει να συζητήσει γύρω από το χρονολόγιο που δημιούργησε, ψάχνοντας για αλλαγές που μπορεί να παρουσιάζουν κάποιο ενδιαφέρον.

[5 λεπτά] Απολογισμός / Παρουσίαση

  • Κάθε ομάδα παρουσιάζει το χρονολόγιο και τα ευρήματά της στους υπόλοιπους (1 λεπτό για κάθε ομάδα).

Αρχειοθέτηση περιεχομένου (40 λεπτά)

Αρχειοθέτηση και διάσωση

Διαβάστε Παρακολουθήστε Ακούστε | 10 λεπτά

Οδηγίες

Προετοιμάστε μια σύντομη παρουσίαση που θα περιλαμβάνει:

  • Πώς αρχειοθετούμε on demand ιστοτόπους/ιστοσελίδες με το Wayback Machine και το Archive Today.

  • Τονίστε ξανά τους τρόπους με τους οποίους η αρχειοθέτηση του διαδικτύου μπορεί να βοηθήσει στην αποθήκευση και στη διάσωση πληροφοριών σε μια έρευνα ή προκειμένου ένας χρήστης να εξασφαλίσει πρόσβαση στη δουλειά που ο ίδιος έχει δημοσιεύσει στο παρελθόν.

  • Κάντε share screen ή χρησιμοποιήστε έναν προτζέκτορα (αν είναι διά ζώσης) για να δείξετε τη διαδικασία με την οποία αποθηκεύουμε μία ιστοσελίδα.

Για το Wayback Machine:

  • Ξεκινήστε από τη σελίδα https://archive.org/web - και την επιλογή Αποθήκευση Σελίδας Τώρα ("Save Page Now")

  • Υπενθυμίστε στους/στις συμμετέχοντες/ουσες το ρόλο που παίζει το αρχείο robots.txt στο να εμποδίσει ενδεχομένως την αρχειοθέτηση τμημάτων ενός ιστότοπου.

  • Είναι σημαντικό να αναφέρετε ότι η χειροκίνητη αποθήκευση ιστοσελίδων θα αρχειοθετήσει μόνο τη σελίδα που καταχωρίσατε (για παράδειγμα, τη σελίδα "http://www.yoursite.com/projects") και όχι όλους τους συνδέσμους που ανακατευθύνουν σε άλλες σελίδες (outlinks), ούτε όλο το περιεχόμενο του ιστοτόπου.

  • Για να αρχειοθετήσει κανείς όλα τα περιεχόμενα ενός ιστοτόπου χρησιμοποιώντας αυτή τη μέθοδο, θα χρειαστεί να καταχωρίσει κάθε σελίδα ξεχωριστά ή να δημιουργήσει έναν δωρεάν λογαριασμό στο Internet Archive, ο οποίος επιτρέπει στους χρήστες να χρησιμοποιήσουν περισσότερες λειτουργίες, όπως η αποθήκευση outlinks μιας ιστοσελίδας.

  • Δείξτε με ποιον τρόπο μπορεί κανείς να δημιουργήσει και να χρησιμοποιήσει δωρεάν έναν λογαριασμό στο Wayback Machine και ποια είναι τα οφέλη: για παράδειγμα, οι χρήστες θα μπορούν να αποθηκεύουν outlinks, να αρχειοθετούν πολλές ιστοσελίδες ταυτόχρονα ή να αποθηκεύουν αρχειοθετημένες σελίδες στο λογαριασμό τους για να μπορούν να τις βρουν ευκολότερα σε δεύτερο χρόνο.

  • Ενημερώστε τους/τις συμμετέχοντες/ουσες ότι μπορούν να χρησιμοποιήσουν τα Google Sheets για να αρχειοθετούν μαζικά ιστοσελίδες, στην περίπτωση που το περιεχόμενο ενός ιστοτόπου δεν έχει αποσπαστεί αυτόματα από το Wayback Machine ή στην περίπτωση που οι ιστοσελίδες πρέπει να αρχειοθετηθούν μία συγκεκριμένη ημερομηνία. Βρείτε περισσότερες λεπτομέρειες και οδηγίες εδώ κι εδώ.

Για το Archive Today:

  • Ξεκινήστε από τη σελίδα https://archive.ph/ και το εργαλείο "My url is alive and I want to archive its content."

  • Διαλέξτε μία δημόσια ιστοσελίδα ή ένα δημόσιο tweet που δεν έχει αρχειοθετηθεί στο παρελθόν και προσπαθήστε να το αναζητήσετε. Στη συνέχεια, χρησιμοποιήστε το Archive Today για να το αρχειοθετήσετε.

  • Αφού το αρχειοθετήσετε, αναζητήστε το με τη διεύθυνση url ακόμα μία φορά και φορτώστε τη σελίδα για να φανούν τα αποτελέσματα.

Περιορισμοί στην online αρχειοθέτηση

Διαβάστε Παρακολουθήστε Ακούστε | 5 λεπτά

Οδηγίες

Προετοιμάστε μία σύντομη παρουσίαση των περιορισμών που μπορεί να αντιμετωπίσει κανείς όταν χρησιμοποιεί το Wayback Machine και το Archive Today. Μιλήστε για τα θετικά και τα αρνητικά των διαφορετικών τεχνικών αρχειοθέτησης. Δώστε έμφαση σε δύο σημεία:

  • Το Wayback Machine δεν μπορεί να καταγράψει και να ανακτήσει πλήρως περιεχόμενο από social media, διαδραστικό περιεχόμενο που έχει δημιουργηθεί σε Flash ή JavaScript, κινούμενες εικόνες / βίντεο και άλλο συναφές περιεχόμενο. Έτσι, άλλες λύσεις μπορεί να φανούν χρήσιμες για τη διάσωση τέτοιου τύπου περιεχομένου, όπως: η λήψη screenshots και η τακτική αποθήκευση αντιγράφων ιστοτόπων.

  • Το Wayback Machine αρχειοθετεί αυτόματα ιστότοπους βάσει της της δημοφιλίας τους και του βαθμού κατάταξής τους. Αυτή η διαδικασία γίνεται αυτόματα και δεν μπορεί κάποιος να ζητήσει την αυτόματη αρχειοθέτηση ενός ολόκληρου ιστοτόπου.

  • Το Archive Today δεν αρχειοθετεί και δεν αποθηκεύει σελίδες αυτόματα, όπως κάνει το Wayback Machine. Η διαδικασία γίνεται χειροκίνητα και ο χρήστης/-τρια πρέπει να βεβαιωθεί ότι έχει διασώσει τους αποθηκευμένους συνδέσμους για να μπορεί να επιστρέψει σε αυτούς σε δεύτερο χρόνο.

  • Υπενθυμίστε στους/στις συμμετέχοντες/ουσες πόσο σημαντικό είναι να μην επαφίεται κανείς σε αρχεία που βρίσκονται online γιατί κάποιες φορές οι διαχειριστές των ιστότοπων μπορεί να ζητήσουν την αφαίρεση των αρχειοθετημένων σελίδων τους. Το να κρατά κανείς αντίγραφα είναι απαραίτητο. Οι χρήστες μπορούν επίσης να αποθηκεύουν αντίγραφα σημαντικών ιστοσελίδων στις συσκευές τους, σε αρχεία HTML ή PDF.

ΥΛΙΚΑ:

Η δική σου χρονοκάψουλα

Εξάσκηση | 10 λεπτά

Οδηγίες

  • Ζητήστε από τους/τις συμμετέχοντες/ουσες να δημιουργήσουν τις δικές τους χρονοκάψουλες επιλέγοντας έναν ιστότοπο ή μια ιστοσελίδα που θα ήθελαν να αποθηκεύσουν για το μέλλον, ακολουθώντας τα προαναφερθέντα βήματα αρχειοθέτησης χρησιμοποιώντας το Wayback Machine και το Archive Today.

  • Οι συμμετέχοντες/ουσες θα πρέπει να προσθέσουν τους συνδέσμους της αρχειοθέτησης σε ένα κοινόχρηστο αρχείο.

Άλλοι τρόποι ανάκτησης και αρχειοθέτησης ιστοσελίδων

Έρευνα | 15 λεπτά

Οδηγίες

  • Χωρίστε τους/τις συμμετέχοντες/ουσες σε μικρές ομάδες των 3-5 ατόμων.

  • Ζητήστε από κάθε ομάδα να ερευνήσει άλλους τρόπους για την ανάκτηση και την αρχειοθέτηση ιστοσελίδων και στη συνέχεια να τους προσθέσει σε ένα κοινόχρηστο αρχείο.

  • Αυτό μπορεί να περιλαμβάνει:

    • να ελέγξουν εκδοχές ιστοσελίδων αποθηκευμένες στην κρυφή μνήμη (cache),

    • να βρουν άλλες πλατφόρμες που φιλοξενούν αρχειοθετημένο περιεχόμενο από social media, ψηφιακές βιβλιοθήκες, χάρτες, ή ακόμα και θεματικά αρχεία που περιλαμβάνουν υλικό από συγκρούσεις, παραβιάσεις ανθρωπίνων δικαιωμάτων, δίκτυα παραπληροφόρησης κτλ.,

    • να αναζητήσουν ποιες άλλες πληροφορίες έχουν αρχειοθετηθεί από το Internet Archive και να παρουσιάσουν τρόπους με τους οποίους θα μπορούσαν να χρησιμοποιηθούν για τη διερεύνηση διαφορετικών θεματικών.

ΣΗΜΕΙΩΣΗ: Προσαρμόστε την άσκηση ανάλογα με τις ανάγκες των συμμετεχόντων.

Πρώτα η Ασφάλεια! (15 λεπτά)

Οι βασικές αρχές της ψηφιακής ασφάλειας

Διαβάστε Παρακολουθήστε Ακούστε | 15 λεπτά

Οδηγίες:

Προετοιμάστε μία σύντομη παρουσίαση που θα παρέχει συμβουλές γύρω από το πώς διεξάγουμε μία έρευνα και για το πώς αρχειοθετούμε ψηφιακό περιεχόμενο. Προτεινόμενο σενάριο:

  • Access logs: όταν κατευθύνετε μία υπηρεσία αρχειοθέτησης προς μία ιστοσελίδα που σας ενδιαφέρει, η υπηρεσία αυτή θα επισκεφθεί την ιστοσελίδα και θα αποθηκεύσει ένα αντίγραφό της. Όταν το κάνει αυτό, η ιστοσελίδα που αρχειοθετείται θα προσθέσει αυτόματα ένα αρχείο σε ένα διαρκώς ανανεούμενο “access log”, το οποίο περιλαμβάνει λεπτομέρειες σε σχέση με το πότε έγινε η επίσκεψη στον ιστότοπο και από ποιες IP διευθύνσεις. Οι περισσότερες υπηρεσίες αρχειοθέτησης κρατούν access logs.

  • Ένας υποψιασμένος διαχειριστής ιστότοπου ή μία αυτοματοποιημένη διαδικασία μπορούν να διαπιστώσουν αν ένα τμήμα του site έχει αρχειοθετηθεί από το Wayback Machine. Έτσι, μπορεί να αντιληφθούν ότι κάποιος ερευνά ένα συγκεκριμένο θέμα ή ένα συγκεκριμένο πρόσωπο που σχετίζεται με αυτό το περιεχόμενο. Αυτό δεν σημαίνει ότι μπορούν να σας εντοπίσουν, αλλά ότι μπορούν να αποκτήσουν παραπάνω στοιχεία σε σχέση με την έρευνα.

  • Για παράδειγμα, ας υποθέσουμε ότι κάποιες λίγες IP διευθύνσεις επισκέφθηκαν την αρχειοθετημένη ιστοσελίδα την ίδια μέρα όταν αυτή προστέθηκε στο Wayback Machine. Με αυτό τον τρόπο, θα ήταν εύκολο για τον διαχειριστή ενός ιστοτόπου να καταλάβει ότι παρακολουθούνται από μία συγκεκριμένη περιοχή.

  • Το Webcite, για παράδειγμα, καταγράφει το λειτουργικό σύστημα και τον browser κάθε χρήστη, όπως και το όνομα domain του παρόχου κάθε χρήστη (βλ. πολιτική απορρήτου του Webcite). Το Archive Today χρησιμοποιεί την IP σας για να επισκέπτεται τις σελίδες που του ζητάτε να αρχειοθετήσει.

  • Μία καλή ιδέα θα ήταν να ενεργοποιήσετε VPN ή να χρησιμοποιήσετε τη μηχανή αναζήτησης Tor όταν δουλεύετε με υπηρεσίες αρχειοθέτησης.

  • Κάποιες υπηρεσίες απαιτούν από τον χρήστη να δημιουργήσει έναν λογαριασμό, να επιλέξει ένα username, να επαληθεύσει τον λογαριασμό του με ένα email ή να τον συνδέσει με έναν λογαριασμό στα social media.

  • Ίσως χρειαστεί να δημιουργήσετε διαφορετικούς λογαριασμούς για αυτές τις υπηρεσίες έτσι ώστε να διαχωρίσετε την ερευνητική σας δουλειά με τους προσωπικούς σας λογαριασμούς.

  • Ακόμα περισσότερο, μπορεί να χρειαστεί να δημιουργήσετε «ταυτότητα» μίας χρήσης για μία συγκεκριμένη έρευνα και να την ξεφορτωθείτε, όταν η έρευνα έχει ολοκληρωθεί. Για παράδειγμα, μπορείτε να δημιουργήσετε έναν σχετικά ασφαλή, ξεχωριστό λογαριασμό email στο tutanota.de ή στο protonmail.com.

  • Αφιερώνοντας λίγο χρόνο πριν ξεκινήσετε την έρευνά σας, μπορείτε να περιορίσετε τέτοιου τύπου κινδύνους.

ΥΛΙΚΑ:

Κλείσιμο (10 λεπτά)

Δραστηριότητα κλεισίματος: Αφίσα για το σπίτι

Παραγωγή | 5 λεπτά

Εργαλεία / Υλικά

  • Shared drawing pad / slide / whiteboard (online)
  • Whiteboard / flip-chart paper, post-its, markers (offline)

Οδηγίες

  • Ζητήστε από τους συμμετέχοντες/ουσες να φτιάξουν στον πίνακα μια αφίσα όπου θα μοιραστούν τις απαντήσεις τους στις ακόλουθες ερωτήσεις:

    • Τι μάθατε από το σημερινό εργαστήριο;
  • Δώστε μερικά λεπτά για να γράψουν/ζωγραφίσουν τις σκέψεις τους και να διαβάσουν τις σκέψεις των άλλων.

Απολογισμός

  • Ο συντονιστής μπορεί να αναδείξει μερικά από τα σημεία στον πίνακα.
Συμπέρασμα

Διαβάστε Παρακολουθήστε Ακούστε | 5 λεπτά

Εργαλεία / Υλικά: Δεν απαιτούνται.

Οδηγίες

  • Ολοκληρώστε το εργαστήριο και κάντε μια περίληψη των περιεχομένων. Σ’ αυτό το σημείο μπορείτε να προσθέσετε κάτι τελευταίο ή να αναδείξετε το βασικό μήνυμα.

  • Κάντε μια σύνοψη κάθε ενότητας. Ζητήστε από τους συμμετέχοντες να πουν:

    • ένα σημείο του εργαστηρίου που βρήκαν πολύ χρήσιμο ή ενδιαφέρον και
    • κάτι που θα μπορούσε να βελτιωθεί την επόμενη φορά
  • Ενθαρρύνετε τους/τις συμμετέχοντες/ουσες να κάνουν ερωτήσεις ή να δώσουν κάποια συμβουλή.

  • Μοιραστείτε τα στοιχεία επικοινωνίας σας, αν χρειάζεται, και τυχόν λεπτομέρειες για follow-up.

Για να είναι οι συμμετέχοντες/ουσες ενήμεροι/ες για το τι συμβαίνει ανά πάσα στιγμή, οι εκπαιδευτές μπορούν να συνοψίσουν το περιεχόμενο του εργαστηρίου ακολουθώντας τα παρακάτω βήματα:

    1. [στην Εισαγωγή] ενημερώστε τους συμμετέχοντες/ουσες για το τι θα ακολουθήσει,
    1. [κατά τη διάρκεια κάθε ενότητας / του εργαστηρίου] υπενθυμίστε σε ποιο στάδιο βρίσκεστε,
    1. [στο τέλος κάθε ενότητας/του εργαστηρίου] εξηγήστε τι κάνατε. Επιπλέον, στο τέλος, οι εκπαιδευτές πρέπει να επισημάνουν τους στόχους που τέθηκαν και ολοκληρώθηκαν.

Συντελεστές και Πνευματικά Δικαιώματα

Το παρόν δημιουργήθηκε από το Tactical Tech, στα πλαίσια του έργου Αποκαλύπτοντας το Αόρατο, και αδειοδοτείται με το Creative Commons Attribution-ShareAlike 4.0 International license

CC BY-SA 4.0


Το υλικό αναπτύχθηκε στο πλαίσιο του Collaborative and Investigative Journalism Initiative (CIJI) που συγχρηματοδοτείται από την Ευρωπαϊκή Επιτροπή στο πλαίσιο του πιλοτικού προγράμματος: "Supporting investigative journalism and media freedom in the EU" (DG CONNECT) («Υποστήριξη της ερευνητικής δημοσιογραφίας και της ελευθερίας των μέσων ενημέρωσης στην ΕΕ»).

Το παρόν κείμενο αντικατοπτρίζει την άποψη του συγγραφέα και η Επιτροπή δεν ευθύνεται για οποιαδήποτε χρήση των πληροφοριών που περιέχει.

Επικοινωνήστε μαζί μας

Παρακαλούμε επικοινωνήστε μαζί μας στο Αποκαλύπτοντας το Αόρατο σε περίπτωση που:

  • έχετε ερωτήσεις σχετικά με το σχεδιάγραμμα και τις κατευθυντήριες γραμμές του εργαστηρίου,

  • χρησιμοποιήσετε το σχεδιάγραμμα και θέλετε να μοιραστείτε σχόλια και προτάσεις που μπορούν να βοηθήσουν στη βελτίωσή του,

  • προσαρμόσετε το σχεδιάγραμμα σε ένα συγκεκριμένο πλαίσιο και θέλετε να μοιραστείτε μαζί μας τα αποτελέσματα,

  • θέλετε να προτείνετε νέες δραστηριότητες, συμβουλές ή παραδείγματα που μπορούν να προστεθούν σε αυτό το εργαστήριο,

  • θέλετε να μοιραστείτε τις γνώσεις σας και να συνεργαστείτε μαζί μας για την ανάπτυξη και τη δοκιμή νέων εργαστηρίων.

Επικοινωνία: eti@tacticaltech.org (GPG Key / fingerprint: BD30 C622 D030 FCF1 38EC C26D DD04 627E 1411 0C02).

Συντελεστές και Άδεια Χρήσης

CC BY-SA 4.0

Παραγωγή περιεχομένου: «Αποκαλύπτοντας το Αόρατο» της Tactical Tech Άδεια χρήσης: Creative Commons Attribution-ShareAlike 4.0 International license

  • Συντάκτες: A. Hayder, Laura Ranca, Wael Eskandar

  • Σχεδιασμός οδηγιών: A. Hayder

  • Σύνταξη & Περιεχόμενο: Christy Lange, Laura Ranca, Wael Eskandar

  • Graphic design: Yiorgos Bagakis

  • Website development: Laurent Dellere, Saqib Sohail

  • Συντονισμός και επίβλεψη έργου: Christy Lange, Laura Ranca, Lieke Ploeger, Marek Tuszynski, Safa Ghnaim, Wael Eskandar

Το υλικό αναπτύχθηκε στο πλαίσιο του Collaborative and Investigative Journalism Initiative (CIJI) που συγχρηματοδοτείται από την Ευρωπαϊκή Επιτροπή στο πλαίσιο του πιλοτικού προγράμματος: "Supporting investigative journalism and media freedom in the EU" (DG CONNECT) («Υποστήριξη της ερευνητικής δημοσιογραφίας και της ελευθερίας των μέσων ενημέρωσης στην ΕΕ»).

Το παρόν κείμενο αντικατοπτρίζει την άποψη του συγγραφέα και η Επιτροπή δεν ευθύνεται για οποιαδήποτε χρήση των πληροφοριών που περιέχει.

Περισσότερα σχετικά με το θέμα