20% от електронните таблици по генетика съдържат грешки от конверсиите на Excel

В електронните таблици на Excel по подразбиране се използва Общ формат. Много хора се сблъскват с това, че Excel най-неочаквано конвертира въведеното значение в дата. Това е най-разпространената грешка на автоматичното конвертиране. За да може тя да се избегне е необходимо вместо Общ формат да се изберат подходящите за числа и текстове формати. 

20%           Excel

От автоматичното конвертиране си патят неопитните потребители на Excel. Но е твърде странно, че сред тези неопитни потребители са голяма част от учените. Автоматичната проверка на публикациите в PubMed показа, че около 20% от таблиците с данни в научните работи по генетика съдържат грешки в имената на гените, дължащи се на конверсиите на Excel.

При сканирането са проверени всички основни генетични символи на човека и се разбра, че Excel автоматично конвертира 35 човешки генетични символа в дати

Имената на генетичните символи се образуват според специални правила, според които максималната дължина е ограничена до 6 символа, а името може да е съкратено или да се използва абревиатура.

Excel се оказа истинско минно поле за генетиците, понеже в генетическата номенклатура има идентификатори като 201E9, 9130022E09, 3e46, NA, NaN. SEP53 и други подобни. Excel конвертира тези символи не само в дати, но и в числа с плаваща точка. Например 2310009E13 се превръща в 2.31E+13.

Анализирани са 35 175 електронни таблици, в които има 7 467 списъка на гени, събрани от 3 597 научни работи.Грешки от конверсиите на Excel са открити в 704 публикувани научни статии или 19,6%. Анализът показа, че броят научни работи с грешки нараства с около 15% годишно, докато ръстът на научните работи е по-малък - 3,8%.

20%           Excel

Специалистите, осъществили проверката, предложиха да бъдат уведомени програмистите на Excel. Това може да стане чрез Excel’s Suggestion Box или чрез Twitter.

 

20%           Excel

Авторите на това интересно изследване отбелязват, че няма начин за перманентно изключване на автоматичното конвертиране на данните не само в Excel, но и в другите електронни таблици, като например LibreOffice Calc и OpenOffice Calc. Всеки път типа на данните трябва да бъде задаван ръчно. Приятно изключение са таблиците Google Sheets, където няма подобно изкривяване на данните.

Коментари
Все още няма коментари
Статистика
Прегледи 154
Коментари 0
Рейтинг
Добавена на24 Авг 2016
ИзточникKaldata

Тагове
Excel