Язык программирования R/Данные
Работа с внешними данными
[править]Загрузка данных (файлов)
[править]x <- foreign::read.spss(имя файла) # открыть файл, сохраненный в SPSS.
После этого мы получаем колонки (variables в терминах SPSS) в векторах состоящих из имени объекта х и имени переменной файла SPSS после знака $. Например, если в файле были переменные var001 и Index, то они теперь хранятся в x$var001 и x$Index соответственно.
Демаскировка имен переменных (для прямой видимости в R) и их маскировка осуществляются командами attach() и detach().
Сохранение данных
[править]Для сохранения текущей сессии вместе с данными необходимо использовать команду
q("yes")
Если же надо экспортировать только данные...
Сохранение результатов
[править]Работа с Hadoop
[править]Какие есть возможности по работе с MapReduce?
Преобразования данных
[править]= Сортировка данных в файле
[править]Объединение файлов
[править]= Добавление наблюдений
[править]Добавление переменных по ключу
[править]Аггрегация файлов
[править]Создание новых файлов с аггрегированными либо частично транспонированными ячейками
Использование SQL
[править]это возможно?
Фильтрация
[править]Фильтрация с удалением
[править]Взвешивание наблюдений
[править]ls() перечислить все активные объекты rm(obj1) удалить объект