Каков наилучший способ выборочного тестирования больших наборов данных? Некоторые устаревшие коды, которые я поддерживаю, имеют структуры из ста членов или более; другие части кода, которые мы работаем над созданием или анализом наборов данных из сотен образцов.Единичное тестирование больших наборов данных?
Наилучший подход, который я нашел до сих пор, заключается в сериализации структур или наборов данных с диска, выполнении проверяемых операций, сериализации результатов на диск, а затем разграничении файлов, содержащих сериализованные результаты, с файлами, содержащими ожидаемые результаты. Это не очень быстро, и это нарушает принцип модульного тестирования «не касайтесь диска». Однако единственная альтернатива, которую я могу придумать (написать код для инициализации и тестирования сотен членов и точек данных), кажется невыносимо утомительной.
Есть ли лучшие решения?
Если вы тестируете сами данные, я считаю, что вам нужно коснуться диска. – MrBoJangles 2008-10-24 22:07:52