Введите Ваш E-mail адрес и Вы будете первым, кто получит новые статьи.

Статьи

Архивирование больших объемов данных: Troia | Примеры лучших практик | Гуманитарные науки | Научные Области | Данные исследований и управление данными исследований

  1. Проект Троя (1987-2012) проект
  2. Данные исследований в проекте
  3. Данные и форматы файлов
  4. Управление и подготовка архива
  5. Архивирование данных - стандартизированный рабочий процесс
  6. Рабочий процесс пилотного проекта
  7. меры

Проект Троя (1987-2012)

проект

Сегодня известный как Троя (также Троя, Турецкий Хисарлык) является археологическим объектом в нескольких километрах к югу от Дарданеллы на северо-западе Турции (провинция Чанаккале). Центральный холм руин состоит из остатков ряда укрепленных поселений бронзового века (около 3000-950 до н.э.). Особенно во время позднего бронзового века в конце 2-го тысячелетия до нашей эры. Также была заселена большая территория за пределами замка («Нижний город»). Позже и вокруг холма был греческий и римский город Илион.

Данные исследований в проекте

С исторической точки зрения исследования, многочисленные, разнородные данные, накопленные за десятилетия. Они варьируются от фотографического документирования находок и находок до рукописной документации по раскопкам, до цифровой обработки и обработки данных с использованием геоинформационных систем (ГИС).

Из-за большого количества данных и их неоднородности этот долгосрочный проект является интересным примером работы с аналоговыми, оцифрованными и цифровыми данными исследований в гуманитарных науках.

После завершения раскопок и связанных с ними проектов в 2016 году начались усилия по переводу всех данных исследований в архивную систему, чтобы сделать их доступными в долгосрочной перспективе.

Данные и форматы файлов

Наиболее частыми данными во время раскопок были аналоговые изображения и заполненная от руки документация (например, научный дневник, формы и списки), хотя в более поздних раскопках собиралось все больше цифровых данных. Все аналоговые данные были оцифрованы с учетом предстоящего архивирования.

  • географическая информация: данные ГИС, такие как Пример: шейп-файлы, растровая графика с географической привязкой и т. Д.
  • Фотографии: фотодокументация находок и находок, чертежи объектов, отсканированная рукописная документация и т. Д.
  • цифровой текст: отчеты, оценка, результаты
  • PDF: отсканированная рукописная документация
  • Таблицы: списки соответствия, таблицы поиска и т. Д.
  • База данных: база данных PostgresSQL

Управление и подготовка архива

Принимая во внимание хорошую управляемость данных и долгосрочное архивирование, все аналоговые данные уже были оцифрованы в последние годы. Аналогичным образом была создана база данных, которая обеспечивает возможность назначения данных для отдельных раскопок.

Ввиду разнообразия данных и форматов данных проект Troia хорошо подходил в качестве пилотного проекта для внедрения данных исследований в архив данных исследований Университета Тюбингена ( FDAT ). Как центральное и постоянное инфраструктурное учреждение, FDAT предлагает ученым университета широкий спектр услуг, а также необходимое техническое оборудование для долгосрочного архивирования и повторного использования данных исследований. Этот репозиторий ориентирован в первую очередь на гуманитарные и социальные науки.

Управление данными проекта Troia также включало окончательную подготовку к архивированию данных в FDAT. Прежде всего, на переднем плане стояло обогащение данных метаданными и преобразование в форматы данных, пригодные для архивирования.

Обогащению метаданными предшествовала категоризация данных на обработанные и административные данные сотрудниками проекта. Для обеспечения достаточного количества ключевых слов идентификаторы схемы метаданных проекта были адаптированы для передачи в FDAT.

Преобразование данных, включенных в этот проект, в основном, файлы изображений, которые обычно хранятся в формате JPG и должны были быть преобразованы в TIFF. Поскольку рукописные записи / рисунки любого вида также были доступны в виде файлов изображений при сканировании, этот процесс включал большую часть данных. Файлы PDF были преобразованы в архивируемый формат PDF / A. Данные, полученные из ГИС проекта, хранятся в формате ASCII, то есть в виде простых текстовых файлов в ZIP-пакетах (растровая графика, векторная графика, шейп-файлы).

Архивирование данных - стандартизированный рабочий процесс

Система архивирования в Тюбингене FDAT основана на руководящих принципах для структур данных (отмеченных синим) и процессов (отмеченных оранжевым) в архивной системе после Открытая архивная информационная система (ISO 14721: 2012) ,

Система архивирования в Тюбингене FDAT основана на руководящих принципах для структур данных (отмеченных синим) и процессов (отмеченных оранжевым) в архивной системе после   Открытая архивная информационная система (ISO 14721: 2012)   ,

Рабочий процесс пилотного проекта

Обилие данных в отдельных ресурсах позволяет запланированный рабочий процесс для создания так называемых SIP (пакет информации о представлении) в этом случае, хотя наборы данных уже были в целом хорошо подготовлены. Поэтому для пилотного проекта необходимо было создать другие подпрограммы, чтобы сгенерировать требуемые SIP, которые затем могут быть обработаны с использованием стандартизированного рабочего процесса.

меры

  1. Выбор данных проектом
  2. Преобразование выбранных данных в архивируемые форматы (при поддержке сотрудников архива)
  3. Назначение метаданных

меры

  1. Передача данных в FDAT: обмен данными через физический носитель данных
  2. Создать схему метаданных для разработки данных исследования
  3. Импорт исследований и метаданных в архивную систему
  4. Присвоение PID (дескриптора) при загрузке в архивную систему

Повторное использование и открытые вопросы

В принципе, данные Troia должны быть не только заархивированы в FDAT и сохранены для внутреннего использования, но также могут быть использованы для других пользователей.

Тем не менее, поскольку система архивирования начала функционировать только в январе 2017 года, все еще существуют некоторые трудности, особенно в отношении правовых аспектов, которые не были полностью прояснены. В результате, вопреки первоначальным намерениям, хранение всех записей данных в открытом доступе часто все еще оставляет вопросы о защите личных прав (например, в случае изображений, на которых также изображены люди); В настоящее время это приводит ко многим ограничениям в последующем использовании данных.

FDAT предоставляет интерфейс для автоматического сбора метаданных третьими лицами ( уборка урожая ). Экспорт данных осуществляется поочередно в форматах Дублинское ядро ​​или 21 марта ,

Похожие

Подготовка к курсу математики по английскому языку, математике, биологии, истории, географии ...
Educational Technologies ™ организует курсы для подготовки к обязательному курсу BSL, а также курсы английского языка, математики, биологии, истории, географии, испанского, немецкого и французского языков.
Карантин в антивирусной программе microsoft security essentials
антивирусная программа Microsoft Security Essentials очень популярна среди пользователей таких операционных систем, как Windows 7 и 8. С последней версией ОС данный антивирус идет по умолчанию. У пользователей может возникнуть такой вопрос, что же такое карантин Microsoft Security Essentials и для чего он нужен, и сейчас мы с этим разберемся.
5 бесплатных редакторов кода для Android
Программирование может быть увлекательным, если с правильными инструментами - инструментами разработки, которые позволяют вам писать и тестировать исходный код без приставания. Кодирование на компьютере, безусловно, более подходящее, но оно не может сравниться с удобством просмотра или редактирование исходного кода откуда угодно. Именно здесь мобильные устройства пригодятся
Создание переключателя освещения Hue с использованием Raspberry Pi Zero
В моей гостиной есть умное освещение "Hue": лампочки, которые я могу включать и выключать, или менять цвет с помощью телефона. Хорошо, но чего-то не хватало: физический выключатель. Давайте исправим это, построив свой собственный! Проблема: когда я прихожу домой, когда на улице темно, я просто щелкаю выключателем, чтобы включить свет в моей гостиной. Теперь я захожу в комнату и замечаю, что выключатель света уже включен. Это связано с тем, что для работы умных лампочек Hue требуется
В Черкасской области появилась сексистские реклама у АЗС на трассе
... итете по рекламе уже считают размер штрафа для заказчика таких изображений. АЗС в Черкасской поздравила женщин с праздником откровенно сексистской рекламой . Скандальный американский плакат, за который уже оштрафовали другое кафе в Сумах, теперь появился в Городище в 170 км от Киева, говорится в сюжете
Создание карт ума. Программное обеспечение и примеры
... данные творчески. Это карта ума Тони Бьюзана. Гораздо более запоминающимся, чем типичный средний, верно? Пример карты разума от Тони Бьюзана Авторы: https://www.tonybuzan.com/about/) Другие выражают абстрактную мысль, которую трудно выразить словами, например, солидарность.
Местное позиционирование вашей компании в Google My Business
Местное позиционирование используется для указания интернет-пользователей, которые ищут места в соответствии с их местоположением. В конечном счете, это увеличивает шансы найти компанию в интернете. С точки зрения клиента, легче найти нужные товары или услуги. Напротив, для компании это увеличивает количество клиентов и прибыль, таким образом, возможность развития. Посмотрите, как это сделать. Локальное позиционирование Учетная запись компании на картах Google - это простой
5 лучших инструментов восстановления паролей Microsoft Office, которые действительно работают
Реклама Защита вашего романа о зомби-романе, который не смог бы подготовить черновик с помощью сверхнадежного пароля, была отличной идеей. До тех пор, пока вы не сможете вспомнить пароль для разблокировки документа Microsoft Office. И сейчас нет возможности войти. К счастью, несколько действительно полезных программ снимают защиту паролем Microsoft Office. Вот пять из лучших. Microsoft Office и защита паролем Прежде чем мы начнем, давайте сделаем одну
10 самых эффективных размеров и форматов баннеров Google AdSense
После регистрации в Google AdSense один из самых распространенных вопросов, который задают новички, - это самые эффективные размеры баннеров Google AdSense? Некоторые форматы рекламы Google AdSense более заметны, что означает, что они получают больше кликов и приносят больший доход. В этой статье мы покажем вам наиболее эффективные размеры и форматы баннеров Google AdSense, а также места их размещения для достижения наилучших результатов.
Что такое «Runtime Broker» и почему он работает на моем ПК?
... и вы читаете эту статью, вы, вероятно, заметили процесс Runtime Broker в своем Диспетчер задач окно и задавался вопросом, что это было - и, возможно, даже почему это иногда всплески использования процессора"> Если вы читаете эту статью, вы, вероятно, заметили процесс Runtime Broker в своем Диспетчер задач окно и задавался вопросом, что это было - и, возможно, даже почему это иногда всплески
Все, что вам нужно знать о Google Home
... данные, компания обновил свою политику конфиденциальности умного дома также. На протяжении более двух лет ландшафт интеллектуальных динамиков быстро менялся. Мы будем обновлять эту часть, так как она продолжает меняться. К счастью, сейчас самое подходящее время для инвестиций в умный динамик. Google, Amazon и Apple борются за превосходство на рынке и быстро внедряют

Комментарии

Как это вписывается в мой рабочий процесс?
Как это вписывается в мой рабочий процесс? Увеличить Zoom использует систему комнат, которая есть и на других платформах. Эта система означает, что вы создаете один URL, который представляет комнату собраний. Каждый раз, когда вы посещаете этот URL, вы попадаете на собрание. Это простая структура, но я считаю ее эффективной ; особенно для командных встреч. Это соответствует рабочий процесс
Хотите узнать больше об этом проекте?
Хотите узнать больше об этом проекте? Прочитайте полное исследование Вот ) Извините за мгновение, пока я освежаюсь Иногда требуется несколько настроек, чтобы логотип выглядел более отточенным и профессиональным. Это то, что бывший клиент Стратегии West Wind Consulting в сборе средств Консалтинговая
Нужны примеры того, как использовать совместные карты?
Нужны примеры того, как использовать совместные карты? Ну вот: Путешествуете по месту, которое некоторые из ваших друзей уже посещали? Поделитесь с ними картой своего назначения и позвольте им отмечать места, которые вам понравились больше всего. Лучше, чем любой путеводитель! Хотите открыть для себя новые места, такие как рестораны или бары, где вы живете? Поделитесь своей пользовательской картой с людьми, которых вы знаете, и попросите их добавить свои любимые места.
Почему некоторые размеры и форматы баннеров Google AdSense работают лучше?
Почему некоторые размеры и форматы баннеров Google AdSense работают лучше? Google AdSense поставляется с несколькими размерами баннеров и форматов рекламы, которые вы можете добавить на свой сайт. Однако не все из них дают одинаковый уровень результатов. Объявления, которые ближе к содержанию и легко видны при загрузке страницы, увеличат рейтинг кликов (рейтинг кликов). Вы должны убедиться, что вы выбираете
Обновляете ли вы информацию о своей компании и активно используете преимущества обмена данными о компании?
Обновляете ли вы информацию о своей компании и активно используете преимущества обмена данными о компании? Локальное позиционирование - Google My Business 5 (100%) Всего голосов 5
Может ли увеличенное изображение показать больше данных?
Может ли увеличенное изображение показать больше данных? Я решил взглянуть на эту тему и попытаться восстановить другие поля. Прежде чем читать дальше, обязательно откройте следующую ссылку на отдельной вкладке: https://niebezpiecznik.pl/app/uploads/2017/09/zgloszen-id.png Используемые инструменты При первом пожаре я взял нечеткие имена родителей, в оригинале почти невозможно прочитать
Может ли этот процесс быть вирусом?
Может ли этот процесс быть вирусом? Сам процесс является официальным компонентом Windows. Хотя возможно, что вирус заменил реального Runtime Broker на собственный исполняемый файл, это очень маловероятно. Мы не видели сообщений о вирусах, которые угоняют этот процесс. Если вы хотите быть уверены, вы можете проверить расположение файла в Runtime Broker. В диспетчере задач щелкните правой кнопкой мыши Runtime Broker и выберите опцию «Открыть расположение файла».
Js в мой проект?
js в мой проект? Нет, цель ng-bootstrap - полностью заменить реализацию JavaScript для компонентов. Не следует также включать другие зависимости, такие как jQuery или popper.js. Это не обязательно и может помешать коду ng-bootstrap Источник Итак, сначала вам нужно установить библиотеку из npm, используя следующую команду: Установка npm --save @ ng-bootstrap / ng-bootstrap После завершения

Гораздо более запоминающимся, чем типичный средний, верно?
Что такое «Runtime Broker» и почему он работает на моем ПК?
Как это вписывается в мой рабочий процесс?
Хотите узнать больше об этом проекте?
Нужны примеры того, как использовать совместные карты?
Ну вот: Путешествуете по месту, которое некоторые из ваших друзей уже посещали?
Хотите открыть для себя новые места, такие как рестораны или бары, где вы живете?
Почему некоторые размеры и форматы баннеров Google AdSense работают лучше?
Почему некоторые размеры и форматы баннеров Google AdSense работают лучше?
Обновляете ли вы информацию о своей компании и активно используете преимущества обмена данными о компании?

Новости