NCCSV -
ΑNetCDF-Συμβατή προδιαγραφή αρχείων ASCII CSV, Έκδοση 1.00
Μπομπ Σάιμονς και Στιβ Χάνκιν "NCCSV" από Bob Simons και Steve Hankin είναι αδειοδοτημένος απόCC με 4.0
Εισαγωγή
Αυτό το έγγραφο ορίζει μια μορφή αρχείου κειμένου ASCII CSV που μπορεί να περιέχει όλες τις πληροφορίες (μεταδεδομένα και δεδομένα) που μπορεί να βρεθεί σεNetCDF .ncαρχείο που περιέχει έναν πίνακα δεδομένων τύπου αρχείου CSV. Η επέκταση αρχείου για ένα αρχείο κειμένου ASCII CSV μετά από αυτή την προδιαγραφή πρέπει να είναι .csv έτσι ώστε να μπορεί να διαβαστεί εύκολα και σωστά σε προγράμματα υπολογιστικών φύλλων όπως το Excel και τα Φύλλα Google. Bob Simons θα γράψει το λογισμικό για να μετατρέψει ένα αρχείο NCCSV σε έναNetCDF-3 (και ίσως επίσηςNetCDF-4) .ncαρχείο, και το αντίστροφο, χωρίς απώλεια πληροφοριών. Ο Μπομπ Σάιμονς έχει αλλάξει.ERDDAP™για την υποστήριξη ανάγνωσης και εγγραφής αυτού του τύπου αρχείου.
Η μορφή NCCSV έχει σχεδιαστεί έτσι ώστε λογισμικό υπολογιστικών φύλλων όπως το Excel και τα Φύλλα Google να μπορούν να εισάγουν ένα αρχείο NCCSV ως αρχείο csv, με όλες τις πληροφορίες στα κύτταρα του υπολογιστικού φύλλου έτοιμα για επεξεργασία. Ή, ένα λογιστικό φύλλο μπορεί να δημιουργηθεί από το μηδέν μετά τις συμβάσεις NCCSV. Ανεξάρτητα από την πηγή του υπολογιστικού φύλλου, αν στη συνέχεια εξαχθεί ως αρχείο .csv, θα συμμορφωθεί με τις προδιαγραφές NCCSV και δεν θα χαθούν πληροφορίες. Οι μόνες διαφορές μεταξύ των αρχείων NCCSV και των αναλογικών αρχείων υπολογιστικών φύλλων που ακολουθούν αυτές τις συμβάσεις είναι:
- Τα αρχεία NCCSV έχουν τιμές σε μια γραμμή που χωρίζεται με κόμματα. Τα λογιστικά φύλλα έχουν τιμές σε μια γραμμή σε παρακείμενα κελιά.
- Οι συμβολοσειρές στα αρχεία NCCSV συχνά περιβάλλονται από διπλά εισαγωγικά. Οι συμβολοσειρές στα λογιστικά φύλλα δεν περιβάλλονται ποτέ από διπλά εισαγωγικά.
- Εσωτερικά διπλά εισαγωγικά (") Στις συμβολοσειρές στα αρχεία NCCSV εμφανίζονται ως 2 διπλά εισαγωγικά. Τα εσωτερικά διπλά εισαγωγικά σε λογιστικά φύλλα εμφανίζονται ως 1 διπλό απόσπασμα.
Δείτε τοΛογιστικό φύλλοενότητα παρακάτω για περισσότερες πληροφορίες.
Ροή
Όπως τα αρχεία CSV γενικά, τα αρχεία NCCSV είναι διαθέσιμα. Έτσι, εάν ένα NCSV παράγεται on-the-fly από έναν εξυπηρετητή δεδομένων όπωςERDDAP™, ο διακομιστής μπορεί να αρχίσει να μεταδίδει δεδομένα στον αιτούντα πριν από τη συγκέντρωση όλων των δεδομένων. Αυτό είναι ένα χρήσιμο και επιθυμητό χαρακτηριστικό.NetCDFτα αρχεία, αντίθετα, δεν μπορούν να κυκλοφορήσουν.
ERDDAP™
Αυτή η προδιαγραφή έχει σχεδιαστεί έτσι ώστε NCCSV αρχεία και το.ncαρχεία που μπορούν να δημιουργηθούν από αυτά μπορούν να χρησιμοποιηθούν από έναERDDAP™Διακομιστής δεδομένων (μέσω τηςΠίνακας EDDFromNccsvFilesκαιΠίνακας EDD από αρχείαNcΤύποι συνόλου δεδομένων) , αλλά αυτή η προδιαγραφή είναι εξωτερικήERDDAP.ERDDAP™έχει αρκετά απαιτούμενα παγκόσμια χαρακτηριστικά και πολλά συν ιστώμενα παγκόσμια και μεταβλητά χαρακτηριστικά, κυρίως με βάση τα χαρακτηριστικά CF και ACDD (βλέπε /docs/server-admin/datasets#global-attributes).
Υπόλοιπο
Ο σχεδιασμός της μορφής NCCSV είναι μια ισορροπία πολλών απαιτήσεων:
- Τα αρχεία πρέπει να περιέχουν όλα τα δεδομένα και τα μεταδεδομένα που θα ήταν σε μια καρτέλαNetCDFαρχείο, συμπεριλαμβανομένων συγκεκριμένων τύπων δεδομένων.
- Τα αρχεία πρέπει να είναι σε θέση να διαβαστούν και στη συνέχεια να γράφονται από ένα λογιστικό φύλλο χωρίς απώλεια πληροφοριών.
- Τα αρχεία πρέπει να είναι εύκολο για τους ανθρώπους να δημιουργήσουν, να επεξεργαστούν, να διαβάσουν και να κατανοήσουν.
- Τα αρχεία πρέπει να είναι σε θέση να αναλυθούν σαφώς από τα προγράμματα υπολογιστών.
Εάν κάποια απαίτηση σε αυτό το έγγραφο φαίνεται περίεργη ή επιλεκτική, είναι πιθανόν να χρειαστεί να ικανοποιηθεί μία από αυτές τις απαιτήσεις.
Άλλες προδιαγραφές
Αυτή η προδιαγραφή αναφέρεται σε αρκετές άλλες προδιαγραφές και βιβλιοθήκες με τις οποίες έχει σχεδιαστεί για να λειτουργεί, αλλά αυτή η προδιαγραφή δεν αποτελεί μέρος κάποιας από αυτές τις άλλες προδιαγραφές, ούτε χρειάζεται καμία αλλαγή σε αυτές, ούτε έρχεται σε σύγκρουση με αυτές. Εάν μια λεπτομέρεια που σχετίζεται με ένα από αυτά τα πρότυπα δεν προσδιορίζεται εδώ, δείτε τις σχετικές προδιαγραφές. Αυτό περιλαμβάνει κυρίως:
- Η σύμβαση χαρακτηριστικών για την ανακάλυψη του συνόλου δεδομένων (ACDD) Πρότυπο μεταδεδομένων: https://wiki.esipfed.org/Attribute\_Convention\_for\_Data\_Discovery\_1-3 .
- Κλίμα και Πρόβλεψη (ΚΦ) Πρότυπο μεταδεδομένων: https://cfconventions.org/Data/cf-conventions/cf-conventions-1.8/cf-conventions.html .
- ΗNetCDFΟδηγός χρήστη (NUG) : https://docs.unidata.ucar.edu/netcdf-java/current/userguide/index.html .
- ΗNetCDFβιβλιοθήκες λογισμικού όπωςNetCDF- Ιάβα καιNetCDF-Γ: https://www.unidata.ucar.edu/software/netcdf/ . Αυτές οι βιβλιοθήκες δεν μπορούν να διαβάσουν αρχεία NCCSV, αλλά μπορούν να διαβάσουν.ncαρχεία που δημιουργήθηκαν από αρχεία NCCSV.
- ΤΖΣΟΝ: https://www.json.org/
Σημείωση
Στην παρούσα προδιαγραφή, παρενθέσεις,\[ \], δηλώνουν τα προαιρετικά στοιχεία.
Δομή αρχείου
Ένα πλήρες αρχείο NCCSV αποτελείται από δύο τμήματα: το τμήμα μεταδεδομένων, ακολουθούμενο από το τμήμα δεδομένων.
Τα αρχεία NCCSV πρέπει να περιέχουν μόνο 7-bit χαρακτήρες ASCII. Εξαιτίας αυτού, το σύνολο χαρακτήρων ή η κωδικοποίηση που χρησιμοποιείται για την εγγραφή και ανάγνωση του αρχείου μπορεί να είναι οποιοδήποτε σύνολο χαρακτήρων ή κωδικοποίηση που είναι συμβατό με το σύνολο χαρακτήρων 7-bit ASCII, π.χ., ISO-889-1.ERDDAP™διαβάζει και γράφει αρχεία NCCSV με το σύνολο χαρακτήρων ISO-8859-1.
Τα αρχεία NCCSV μπορούν να χρησιμοποιούν είτε νέα γραμμή (\n) (που είναι κοινό στους υπολογιστές Linux και Mac OS X) ή μεταφοράΕπιστροφή συν νέα γραμμή (\r\n) (που είναι κοινό στους υπολογιστές των Windows) ως δείκτες τέλους γραμμής, αλλά όχι και τα δύο.
.nccsvΜεταδεδομένα
Όταν τόσο ο δημιουργός όσο και ο αναγνώστης το περιμένουν, είναι επίσης δυνατό και μερικές φορές χρήσιμο να γίνει μια παραλλαγή ενός αρχείου NCCSV το οποίο περιέχει μόνο το τμήμα μεταδεδομένων (συμπεριλαμβανομένων των\*ΤΕΛΟΣ\_ΜΕΤΑΔΑΤΑ\*γραμμή) . Το αποτέλεσμα παρέχει πλήρη περιγραφή των χαρακτηριστικών του αρχείου, των μεταβλητών ονομάτων και των τύπων δεδομένων, εξυπηρετώντας έτσι τον ίδιο σκοπό με το .das plus .dds απαντήσεις από έναOPeNDAPΔιακομιστής.ERDDAP™θα επιστρέψει αυτή την παραλλαγή αν ζητήσετε το αρχείο Τύπος =.nccsvΜεταδεδομένα από έναERDDAP™Σύστημα δεδομένων.
Το τμήμα μεταδεδομένων
Σε ένα αρχείο NCCSV, κάθε γραμμή του τμήματος μεταδεδομένων χρησιμοποιεί τη μορφή
μεταβλητή Όνομα,χαρακτηριστικό Όνομα,τιμή1\[, αξία2\]\[, αξία3\]\[, αξία4\]\[...\]
Χώροι πριν ή μετά τα αντικείμενα δεν επιτρέπονται επειδή προκαλούν προβλήματα κατά την εισαγωγή του αρχείου σε προγράμματα υπολογιστικών φύλλων.
Συμβάσεις
Η πρώτη γραμμή ενός αρχείου NCCSV είναι η πρώτη γραμμή του τμήματος μεταδεδομένων και πρέπει να έχει ένα\ΠΑΓΚΟΣΜΙΑ\Οι συμβάσεις αποδίδουν τον κατάλογο όλων των συμβάσεων που χρησιμοποιούνται στο αρχείο ως συμβολοσειρές που περιέχουν κατάλογο CSV, για παράδειγμα: \ΠΑΓΚΟΣΜΙΑ\,συμβάσεις,"COARDS, CF-1,6, ACDD-1,3, NCCSV-1,0" Μία από τις συμβάσεις που απαριθμούνται πρέπει να είναι η NCCSV-1.0, η οποία αναφέρεται στην τρέχουσα έκδοση της παρούσας προδιαγραφής.