2015-06-28 2 views
0

Я являюсь реквестром на Mturk. Я опубликовал несколько научных обзоров по Mturk, и я хочу, чтобы мои данные были доступны в Интернете. Каждая строка в моих данных соответствует ответам одного работника Mturk. Строка также содержит идентификатор Mturk этого работника. Эти идентификаторы выглядят примерно так: A4DAQF3ZHHBFIX. У меня есть 599 различных идентификаторов. Я хочу сделать функцию в Excel, которая преобразует эти идентификаторы в другой текст, чтобы защитить анонимность рабочих. Очевидно, что разные идентификаторы должны соответствовать различным новым идентификаторам. Любой совет?Scramble/descramble ID пользователя Mturk для защиты их анонимности

благодаря Сэм

ответ

0

невидимости является лучшей безопасности. Почему бы не полностью отказаться от идентификаторов и просто опубликовать данные с строками? Предположительно, вы сохраните свою собственную копию данных и не должны беспокоиться о возможности восстановления данных из того, что вы публикуете.

Вы могли бы сделать что-то вроде этого:

1) Создать новый столбец

2) В этой колонке введите формулу = RAND() и скопировать его вниз через 599 строк с данными

3) Скопируйте эти случайные числа и вставьте их обратно на место с помощью специальной пасты в качестве значений

4) Отсортируйте данные в соответствии с этим новым столбцом.

5) Скопируйте книгу, удалите столбец ID и этот новый столбец

6) Опубликовать в результате вещи, возможно, с оговоркой, что строки появляются в случайном порядке

+0

Привет. Я подумал об этом, но причина, по которой мне нужна функция 1 к 1 для идентификаторов mturk -> новые идентификаторы, заключается в том, что некоторые люди дважды вошли в опрос, т. Е. У меня есть дубликаты. У меня есть сценарий, показывающий, как я удалил этих людей, и я хочу поделиться этим. –

0

Это немного работы , но вы можете шифровать идентификаторы пользователей MTURK в Excel (см https://www.youtube.com/watch?v=JQYLZ5IK1Zw для примера того, как сделать это.

легко управлять всеми идентификаторы через лист шифрования с использованием таблицы данных. См http://www.excel-easy.com/examples/data-tables.html для примера как это сделать.

+0

отлично, это должно сработать! Большое спасибо –

+0

Это видео было довольно приятным, спасибо, что указали на это, но я боюсь, что было бы неплохо использовать его в предполагаемом приложении (по крайней мере без существенной настройки). Он описывает простой сдвиг Цезаря - наименее безопасный из уже незащищенных подстановочных шифров. Один человек, который знает свой собственный идентификатор и может идентифицировать свою строку в опубликованных результатах, может определить коэффициент перевода в видео и, следовательно, расшифровать все другие идентификаторы. С сотнями людей есть приличный шанс, что по крайней мере некоторые из них знают, как решать простые криптограммы. –