Анализ данных в среде R. Атрибутивный Gage R&R (Attribute Agreement Analysis) Анализ r

Зазимко Валентина Лентьевна К.э.н., ст. преподаватель кафедры экономического анализа ФГБОУ ВПО «Кубанский ГАУ»

Традиционный подход к анализу финансового положения базируется на общей концепции «равновесия систем», заимствованной в странах с рыночной экономикой (рисунок 1).

Рисунок 1 — Методика анализа финансового состояния, отвечающая западной концепции «равновесия» системы

Между тем, такие проблемы, как: 1) несоответствие некоторых методических подходов условиям российской специфики ведения бизнеса; 2) не принятие о внимание социального характера аграрной отрасли экономики в России (при дифференциации подходов к оценке в зависимости от отраслевой принадлежности организаций); 3) анализ главных факторов влияющих на эффективность бизнеса с использованием статистического анализа; 4) структуризация методики анализа финансового состояния (по меньшей мере, в целях восстановления лингвистической справедливости); 5) соответствие финансового анализа современным запросам субъектов экономики и неоднозначная трактовка заимствованных экономических категорий, — исследованы с недостаточной полнотой.

Основным направлением совершенствования методики анализа финансового состояния организации должно стать принятие во внимание:

Существующего политического климата и государственного подхода при оценке экономических явлений, процессов, результатов хозяйствования;

Особенностей законодательной регламентации составления бухгалтерской отчетности (в особенности это касается пересмотра подходов в оценке платежеспособности организации);

Отраслевой структуры имущества хозяйствующего субъекта;

Современных параметров оценки эффективности ведения бизнеса.

Целью анализа финансового состояния организации становится объективная оценка финансовой ситуации и перспектив ее развития, учитывающая существующее положение в отрасли в конкретном временном интервале, соответствующем общеполитической и экономической стратегии в отношении объекта исследования.

Аграрные преобразования современной эпохи в истории России глубоки и значимы: со второй половины 2005 г. Правительство Российской Федерации существенно активизировало свой интерес к сельскому хозяйству, инициировав в числе прочих национальный проект «Развитие АПК»; в конце 2006 г. принят Федеральный закон «О развитии сельского хозяйства». Государственная политика поддержки сельского хозяйства предусматривает стимулирование привлечения кредитов на условиях субсидирования выплаты процентов. Ослабление финансовой независимости Обществ, как следствие осуществляемых мероприятий, согласно общепринятым подходам к определению финансового состояния, оценивается отрицательно. По оценкам отечественных экономистов, признающих недостатки существующей методики расчета показателей финансового состояния сельскохозяйственных товаропроизводителей, применяемой, в том числе арбитражными судами (табл. 1), в стране не было бы столько обанкротившихся хозяйств.

Таблица 1. Фрагмент расчета коэффициентов для отнесения сельскохозяйственных товаропроизводителей к группам финансовой устойчивости должника

Коэффициенты:

Группы

финансовой

независимости

0,56≤К<0,6

0,5≤К<0,56

0,44≤К<0,5

финансовой независимости в отношении формирования запасов и затрат

0,65≤К<0,8

обеспеченности собственными оборотными средствами

Изучение финансового состояния организации должно отвечать концепции системности. Методика анализа финансового состояния организации, при этом, предстает в виде согласованной последовательности, что позволяет констатировать факт восстановления лингвистической справедливости термина «методика». Она состоит из шести основных этапов, общая блок-схема приведена на рисунке 2.


Рисунок 2 — Блок-схема реализации этапов анализа финансового состояния сельскохозяйственных организаций

Сбор информации заключается в составлении списка вопросов и получении соответствующих данных от исследуемой организации и из других источников. Изучение условий функционирования систем должно стать предварительным этапом анализа, что обусловлено задачей непременного синтеза внутренних и внешних факторов, возникающей с учетом особенностей эволюции экономического анализа в России, описанного выше. Так, для сельскохозяйственных организаций специфичным является изучение географических и погодно-климатических условий хозяйствования анализируемого субъекта. Структурирование исходной информации должно предполагать составление срезов данных, которые должны входить в информационную базу анализа финансового состояния организации с ее основными характеристиками: отраслевой принадлежностью, масштабом бизнеса и прочими.

На следующем этапе следует в сформированном массиве информации выделить показатели, являющиеся наиболее важными критериями результативности деятельности. Выше остальных показателей многие ученые — аналитики, как зарубежные, так и российские, ставят показатели рентабельности. Так, Э. Альтман в своей широко известной пятифакторной «Z-модели» по определению вероятности потенциального банкротства два фактора из пяти представил показателями рентабельности. Значимость показателей рентабельности отражается также в «Золотом правиле экономики», заключающемся в том, что темпы роста балансовой прибыли должны превышать темпы роста выручки от реализации продукции, а темпы роста реализации должны превышать темпы роста активов.

Критерием выделения фаз в графике традиционного жизненного цикла также выступает показатель рентабельности (ось ординат на рисунке 3).


Рисунок 3 — Жизненный цикл организации

В совокупности с абсолютными финансово-результативными показателями, ключевыми индикаторами деятельности сельскохозяйственной организации становятся: валовая продукция в текущих ценах реализации, выручка и прибыль (убыток) от продажи продукции (работ, услуг), прибыль (убыток) отчетного года, чистая прибыль (убыток), коэффициент оборачиваемости операционного капитала, рентабельность собственного капитала, рентабельность операционного капитала.

Система показателей, предлагаемых для целей анализа финансового состояния субъектов хозяйствования аграрного сектора экономики, была апробирована на примере фактических данных ЗАО «Агрофирма «Кавказ» Краснодарского края. Организация занимает далеко не последнее место в рейтинге трехсот наиболее крупных и эффективных сельскохозяйственных фирм по итогам 2003-2007 гг., входящих в клуб «Агро-300».


Рисунок 4 — Динамика финансово-результативных показателей ЗАО «Агрофирма «Кавказ»

Анализ абсолютных финансово-результативных показателей свидетельствует о развитии и росте фирмы (рисунок 4). Так, неуклонная динамика в обозначенном направлении характерна для показателей валовой продукции (+ 39 %), выручки от реализации продукции (+ 43,9 %), а также конечного финансового результата деятельности (+ 16,8 %). Среди факторов, положительно повлиявших на динамику показателей можно назвать увеличение объема произведенной и товарной продукции растениеводства — прежде всего, зерна (на 3,4 %), сахарной свеклы (13,9 %), подсолнечника (47,9 %) и молока (9,9 %). Показатель рентабельности операционного капитала за отчетный период по сравнению с базисным увеличился, что доказывает высокую эффективность деятельности акционерного Общества.

В целях выявления значимых факторов, влияющих на уровень эффективности бизнеса, проведен корреляционно-регрессионный анализ эффективности ведения бизнеса 46 сельскохозяйственных организаций центральной зоны Краснодарского края. В качестве результативного показателя (у) принят уровень рентабельности собственного капитала (в процентах), рассчитываемый как соотношение чистой прибыли (убытка) отчетного года и среднегодового остатка собственного капитала. Выбор именно этого показателя объясняется его чрезмерной востребованностью внешними пользователями финансовой отчетности как в качестве индикатора, характеризующего не только эффективность бизнеса, но и его рискованность, стратегические перспективы платежеспособности и качество управления бизнесом. Для анализа были отобраны ключевые показатели-факторы, потенциально влияющие на степень рентабельности собственного капитала; поиск и расчет этих факторов возможно осуществить на основании публичной финансовой отчетности. Это: х 1 — доля собственного капитала в валюте баланса, %; х 2 — коэффициент соотношения между заемным и собственным капиталом (коэффициент финансового левериджа); х 3 — доля ликвидных средств в активах, %; х 4 – коэффициент оборачиваемости активов (ресурсоотдача).

Анализ парных коэффициентов корреляции показал, что между рентабельностью собственного капитала и коэффициентом соотношения заемного и собственного капитала, согласно шкале Чеддока, существует прямая и довольно тесная связь, что подтверждает утверждение, что поиск рационального соотношения между заемными и собственными источниками финансирования — есть явный путь к повышению эффективности последних. Обратная средняя связь между результативным показателем и долей собственного капитала в валюте баланса (таблицы 2 и 3) свидетельствует о том, что рентабельность собственного капитала в современных условиях растет в случае снижения его доли в общем капитале. Вместе с тем, прослеживается прямая средняя связь между рентабельностью собственного капитала и долей ликвидных средств в активах и прямая слабая — между ней (рентабельностью) и отдачей активов.

Таблица 2. Матрица парных коэффициентов корреляции четырехфакторного уравнения множественной регрессии

Анализ β-коэффициентов свидетельствует о том, что самое слабое влияние на изменение рентабельности собственного капитала оказывает доля собственного капитала в валюте баланса, а самое сильное — коэффициент соотношения между заемным и собственным капиталом. При этом именно по второму признаку исследуемая совокупность сельскохозяйственных организаций крайне неоднородна. Кроме того, данная совокупность неоднородна по рентабельности собственного капитала, доле собственного капитала в валюте баланса и доле ликвидных средств в активах, что свидетельствует о разном уровне организации производственно-финансовой деятельности и ее эффективности в хозяйствах.

Таблица 3. Общая характеристика рентабельности собственного капитала и отобранных факторов, 2006 г.

Признак

Среднее значение

Парные коэффициенты

корреляции

у — рентабельность собственного капитала, %

х 1 - доля собственного капитала в валюте баланса, %

х 2 - коэффициент соотношения между заемным и собственным капиталом

х 3 — доля ликвидных средств в активах, %

х 4 — коэффициент оборачиваемости активов (ресурсоотдача)

Уравнение множественной регрессии, полученное в результате решения, имеет вид:

у = -12,454-0,164х 1 +0,688х 2 +0,905х 3 +39,335х 4 . (1)

Положительное значение коэффициента при х 2 — свидетельство того, что при рациональных методах ведения сельского хозяйства и нормальном соотношении рентабельности активов и процентов по уплате процентов по привлекаемым заемным источникам финансирования, доходность собственных ресурсов должна возрастать.

Таблица 4. Общие результаты оценки четырехфакторной регрессионной модели

Связь между рентабельностью собственного капитала и всеми факторами, включенными в модель, тесная (множественный коэффициент корреляции R=0,901) и статистически значимая (таблица 4). При этом линейное уравнение объясняет 81,2 % варьирования рентабельности собственного капитала. Остальные приходятся на долю случайных неучтенных факторов.

Практически для расчета уровня эффективности бизнеса сельхозтоваропроизводителей и путей ее повышения в работе определены основные факторы, и степень их влиянии на результативный показатель. Определено, что в доходность собственного капитала исследуемой совокупности сельскохозяйственных организаций: снижается при увеличении доли собственного капитала в структуре источников финансирования (рентабельность собственного капитала возрастает лишь до определенного уровня собственного капитала и начинает снижаться при дальнейшем росте его доли в структуре баланса); возрастает с увеличением коэффициента финансового левериджа, отражающего соотношение заемного и собственного капитала и характеризующем зависимость прибыли от структуры источников финансирования, что возможно при льготном налогом бремени и поддержке хозяйств со стороны Правительства РФ; имеет растущую динамику при увеличении доли ликвидных активов в структуре имущества организации, что логично в свете исполнения расчетно-платежной дисциплины, и является следствием роста деловой активности организации, проявляющемся в возрастании дохода (выручки) от реализации сельскохозяйственной продукции и прочих видов деятельности (приоритет маркетинговой стратегии деятельности организации); увеличивается с повышением уровня использования собственных активов организацией (приоритетная задача финансового менеджмента организации).

Отсюда, становится возможным формировать верный вектор повышения эффективности бизнеса сельскохозяйственных организаций посредством использования четких механизмов, способствующих ее росту. В самом общем виде таковыми механизмами являются: 1) обоснованное определение источников финансирования деятельности организации; 2) повышение эффективности использования ресурсов организации на основе стабилизации взаимных расчетов и системы расчетно-платежной дисциплины; 3) совершенствование системы управления производством.

Исследование динамики рентабельности собственного капитала сельскохозяйственных организаций в зависимости от фактического уровня доли собственного капитала в структуре источников финансирования показало, что наибольшее значение показателя эффективности использования собственного капитала зафиксировано при уровне собственного капитала в интервале от 44 до 58 % . При дальнейшем росте собственного капитала в структуре источников, наблюдается снижение рентабельности (рисунок 5).


Рисунок 5 — Динамика рентабельности собственного капитала в зависимости от удельного веса собственных средств в структуре капитала

Изучение влияния финансовой стратегии организации в отношении использования заемных средств продолжает описываемую последовательность.

Приемлемое место здесь приобретает разработанная методика определения рационального соотношения заемных и собственных средств во взаимосвязи с рентабельностью собственного капитала и льготным кредитованием сельскохозяйственных организаций.

Из всего набора относительных показателей финансовой устойчивости мы предлагаем рассчитывать коэффициент финансовой независимости (Equity to Total Assets), характеризующий проводимую политику в области финансирования и отражающий удельный вес собственного капитала в структуре источников имущества, и коэффициент соотношения заемного и собственного капитала (коэффициент финансового левериджа, или «плечо финансового рычага»), характеризующий степень риска организации.

Коэффициенты структуры капитала характеризуют степень защищенности кредиторов и инвесторов от возможной неуплаты долгов и практически не дают информации об экономическом потенциале организации. Описанную проблему «решает» показатель, характеризующий зависимость прибыли от расходов, связанных со структурой источников финансирования деятельности организации — «эффект финансового рычага».

ЭФР = (1-Несх) (ЧРа -ПК) х (ЗК/СК), (2)

где ЭФР — эффект финансового рычага, заключающийся в приросте коэффициента рентабельности собственного капитала, %; Несх — ставка единого сельскохозяйственного налога, выраженная десятичной дробью; ЧРа — коэффициент валовой рентабельности активов, %; ПК — средний размер процентов за кредит, уплачиваемых организацией за использование заемного капитала, %; ЗК — средняя сумма используемого организацией заемного капитала; СК — средняя сумма собственного капитала организации.

Формула (2) получена путем учета особенностей формирования данных в бухгалтерской отчетности российских организаций, а также налогообложения сельхозтоваропроизводителей: 1) вместо всей величины используемого капитала, по нашему мнению, следует из его значения вычесть сумму кредиторской задолженности организации; 2) «сумма валовой прибыли без учета расходов по уплате процентов за кредит» заменена на показатель «прибыли от продажи продукции (работ, услуг)»; 3) налог на прибыль, уплата которого осуществляется при общем режиме налогообложения не рассматривается автором как фактор, влияющий на величину эффекта: в соответствии с действующим законодательством , сельхозтоваропроизводители уплачивают единый сельскохозяйственный налог, который и был введен в формулу.

Таблица 5. Динамика показателей финансовой устойчивости ЗАО «Агрофирма «Кавказ»

Итак, доля заемного капитала по отношению к собственному в ЗАО «Агрофирма «Кавказ» на конец 2006 года, по данным таблицы 5, составила 52,8 %, что на 42,1 п.п. больше уровня базисного года. Увеличение доли заемного капитала в структуре пассива бухгалтерского баланса — свидетельствует о переходе от консервативной к умеренной финансовой политике; и хотя это и связано с ослаблением автономии хозяйствующего субъекта, — при определенных условиях, это может привести к росту рентабельности собственного капитала. Следует отметить, что степень деловой активности сельхозтоваропроизводителей не столь высока для осуществления и в дальнейшем такой политики финансирования, а значит, следует тщательно изучить последствия проводимых изменений и принять рациональное решение.

Результаты проведенных расчетов определения эффекта финансового рычага для ЗАО «Агрофирма «Кавказ» (таблица 6) свидетельствуют о его положительной динамике: значение в 2006 г. составило 2,5%, что на 3,3 п.п. больше уровня базисного года. Следовательно, ЗАО «Агрофирма «Кавказ», сформировав свои активы на 65 % за счет собственных средств и на 35 % за счет заемного капитала, увеличило рентабельность собственного капитала на 2,5 % при прочих равных условиях, за счет того, что за кредитные ресурсы оно платит с учетом проводимой Правительством РФ политики льготного кредитования сельхозтоваропроизводителей, а рентабельность совокупного капитала составляет 16,2 %. Факторный анализ модели эффекта финансового рычага показал, что в сложившихся условиях выгодно использовать заемные средства в обороте организации, так как следствием тому является повышение эффективности использования собственного капитала. Значит, привлекая заемные ресурсы, анализируемая организация может увеличить собственный капитал, при условии превышения рентабельности инвестированного капитала над ценой привлеченных ресурсов.

Таблица 6. Механизм формирования эффекта финансового рычага

Показатель

2004 г.

2005 г.

2006 г.

Изменение за период (+,-)

Прибыль от реализации продукции, работ, услуг, тыс. руб.

Проценты к уплате, тыс. руб.

Сумма прибыли от реализации продукции, работ, услуг с учетом расходов по уплате процентов за кредит, тыс. руб.

Среднегодовая величина используемого капитала (активов) за минусом кредиторской задолженности, тыс. руб.

Коэффициент финансового левериджа

Рентабельность совокупного капитала, %

Средневзвешенная номинальная цена заемных ресурсов, %

Эффект финансового рычага, %

Отклонение эффекта финансового рычага всего, %

в том числе за счет:

Уровня рентабельности активов, %

Ставки ссудного процента, %

Коэффициента финансового левериджа, %

Для определения границ роста финансового рычага следует применять модель, разработанную французскими учеными Ж. Конаном и М. Гольдером . Объяснением тому служит состав критериев, который наиболее адаптирован к требованиям построения отечественной бухгалтерской отчетности. Чем меньше по значению оценочный показатель, тем ниже вероятность задержки платежей фирмой. Фактические значения критериев, рассчитанные по данным ЗАО «Агрофирма «Кавказ», представлены в таблице 7.

Таблица 7. Оценка вероятности задержки платежей ЗАО «Агрофирма «Кавказ»

Показатель

2004 г.

2005 г.

2006 г.

Отношение суммы денежных средств и дебиторской задолженности к активам (У1)

Отношение суммы собственного капитала и долгосрочных пассивов к источникам покрытия имущества (У2)

Отношение финансовых расходов к выручке от реализации (У3)

Отношение расходов по обслуживанию персонала к добавленной стоимости (У4)

Отношение прибыли до выплаты процентов и налогов к заемному капиталу (У5)

Оценка вероятности задержки платежей:

Q=-0,16хУ1-0,22хУ2+0,87хУ3+0,10хУ4-0,24хУ5

Расчеты показывают, что вероятность задержки платежей фирмой очень мала, однако, динамика интегрального показателя стремится к нулю, а значит, уровень платежеспособности в перспективе — под угрозой. Что волне оправдано на фоне роста величины заемных средств и расходов по обслуживанию долга. В целях предотвращения возможных затруднений необходим оперативный мониторинг расчетно-платежной дисциплины.

С целью синхронизации положительного и отрицательного денежных потоков необходимо оперативное управление платежеспособностью. Авторы исследования категорически против использования в качестве индикаторов платежеспособности коэффициентов ликвидности в силу противоречия требованию бухгалтерского учета о непрекращающейся деятельности. Степень платежеспособности, на наш взгляд, зависит от наполнения финансово-результативных показателей реальными денежными средствами. Использование зачетных операций в расчетах, замещение денежных средств дебиторской задолженностью создает угрозу способности организации отвечать по своим текущим обязательствам.

В настоящее время не уделяется достаточного внимания анализу денежных потоков (cash-flow). Между тем, это самый не противоречивый, позволяющий проследить степень достаточности денежных средств для покрытия краткосрочных обязательств, метод. Ендовицкий Д.А. предлагает сравнивать чистый денежный поток от текущей деятельности с прибылью от продаж. Отрицательная величина чистого денежного потока, при этом, при наличии прибыли от продаж будет свидетельствовать о том, что формирование оборотного капитала требует больших финансовых вливаний. Данная ситуация может привести к несостоятельности. Причины: в низкой рентабельности продаж, больших затратах на формирование оборотного капитала.

Таблица 8. Соотношение чистого денежного потока и прибыли от продаж, тыс. руб.

Чистый денежный поток от текущей деятельности в ЗАО «Агрофирма «Кавказ» положителен, однако, более детально достаточность денежных поступлений для финансирования оборотного капитала продемонстрирует факторный анализ (формула 3):

, (3)

где Дптд — денежный приток по текущей деятельности, тыс. руб., ОК — оборотный капитал, тыс. руб.; Дотд — отток средств по текущей деятельности, тыс. руб. Результативный показатель (Кдост1 ) в заданной зависимости характеризует способность организации финансировать оборотный капитал, показывает достаточность денежных притоков для покрытия расходов, связанных с финансированием оборотного капитала. Рекомендуемое значение показателя должно быть не менее 1.

1. Влияние изменения коэффициента чистого денежного притока по текущей деятельности: . (4)

2. Влияние изменения оттока денежных средств, приходящихся на один рубль оборотного капитала: . (5)

Таблица 9. Данные для факторного анализа коэффициента достаточности денежных поступлений для финансирования оборотного капитала, тыс. руб.

Показатель

Годы

Отклонения

Денежный приток по текущей деятельности, тыс. руб.

Отток по текущей деятельности, тыс. руб.

Общий отток денежных средств по всем видам деятельности, тыс. руб.

Коэффициент достаточности денежных поступлений для финансирования оборотного капитала

Коэффициент чистого денежного потока по текущей деятельности

Доля оттока денежных средств по текущей деятельности общему оттоку денежных средств по всем видам деятельности, тыс. руб.

Отток денежных средств по текущей деятельности, приходящихся на 1 руб. оборотного капитала

Чистый денежный поток от всех видов деятельности, тыс. руб.

Коэффициент достаточности чистого денежного потока для покрытия краткосрочных обязательств

Чистый денежный поток на 1 руб. выручки

Выручка от продаж на 1 руб. краткосрочных обязательств, руб.

Отношение чистого денежного потока к величине чистой прибыли

Коэффициент соотношения темпов роста дебиторской задолженности и объема продаж

Таким образом, положительное изменение коэффициента достаточности денежных поступлений за анализируемый период (+0,148) обусловлено увеличением оттока денежных средств по текущей деятельности на покрытие оборотного капитала. Отрицательное влияние на коэффициент оказал опережающий темп роста оттока денежных средств над темпом роста их притока.

По данным ЗАО «Агрофирма «Кавказ», коэффициент соотношения притока денежных средств и оттока по текущей деятельности в отчетном периоде составил 1,018, динамика коэффициента при этом отрицательна — уменьшение на 0,076. Однако это вовсе не означает недостаток денежных средств для покрытия краткосрочных обязательств. Коэффициент достаточности денежных потоков для покрытия краткосрочных обязательств весьма приемлем как в предыдущие, так и в отчетном периодах (соответственно 0,966, 4,216 и 2,780).


Регулярный контроль за текущим состоянием денежных средств

Рисунок 6 — Этапы анализа платежеспособности сельскохозяйственной организации

Следующим этапом следует оценить качество прибыли (формула 4):

, (4)

где ЧДП — чистый денежный поток по всем видам деятельности, тыс. руб., ЧП — чистая прибыль, тыс. руб.

Если по результатам деятельности организация имеет устойчивый отрицательный чистый денежный поток, это может привести к финансовой несостоятельности, вызванной фактическим уменьшением ресурсов и снижением экономического потенциала организации. В анализируемой ситуации, как видно из таблицы 9, организацией получена чистая прибыль, при этом на каждый рубль прибыли приходится 3 рубля сальдированного результата сравнения притока и оттока денежных средств. Исследование возможностей оценки платежеспособности сельскохозяйственной организации позволило сформулировать план анализа, представленный на рисунке 7.

Результаты проведенного исследования во всей полноте основаны на реалиях работы сельскохозяйственных организаций. Тем самым разрешается проблема отсутствия отраслевой специфики в существующих методиках финансового анализа. Практическая значимость исследования состоит в том, что на основе разработанной методики для сельскохозяйственных организаций, предлагаются основы формирования рациональной финансовой политики в трансформирующейся экономической ситуации сельской отрасли. Использование рекомендуемой методики позволит более точно измерить уровень финансового риска и выработать более эффективный механизм управления им в целях повышения результативности предпринимательской деятельности.

R-анализ, или приемлемость критериальных подходов в оценке финансового состояния сельскохозяйственных организаций

В сложившихся экономических условиях основной упор в деятельности финансовых служб коммерческих предприятий сфокусирован на оперативном отслеживании индикаторов финансового состояния организации. Приоритет при этом отдается относительным показателям, характеризующим соотношение данных отчетности, несущее ту или иную информацию. Говоря терминологическим языком, метод анализа деятельности компании, основанный на описанном подходе, носит название R- анализа, или анализа финансовых коэффициентов.

Набор коэффициентов в рамках отдельного хозяйствующего субъекта зависит от стратегии и цели, которые он хочет достичь. При этом выявляются коэффициенты, которые следует рассчитывать, и устанавливаются их нормативные значения. Эта работа обычно выполняется в рамках проекта постановки управленческого учета, бюджетирования или системы сбалансированных показателей. «Если же набор показателей взять из учебника по финансам,- отмечают практикующие аналитики,- такой финансовый анализ не принесет предприятию никакой пользы» /10/.

Между тем, отдельные показатели, касающиеся аспектов финансирования организацией своей деятельности, сложились традиционно и включаются во все методические алгоритмы, в том числе и законодательно регламентированные.

Речь идет, о нижеследующих показателях:

I. Liquidity Ratios — Коэффициенты ликвидности

Показатели ликвидности характеризуют способность компании удовлетворять претензии держателей краткосрочных долговых обязательств.

1. Коэффициент абсолютной ликвидности

Показывает, какая доля краткосрочных долговых обязательств может быть покрыта за счет денежных средств и их эквивалентов в виде рыночных ценных бумаг и депозитов, то есть практически абсолютно ликвидных активов.

2. Коэффициент срочной ликвидности (Acid test ratio, Quick ratio)

Отношение наиболее ликвидной части оборотных средств (денежных средств, дебиторской задолженности, краткосрочных финансовых вложений) к краткосрочным обязательствам. Обычно рекомендуется, чтобы значение этого показателя было больше 1. Однако реальные значения для российских предприятий редко составляют более 0.7 — 0.8, что признается допустимым.

3. Коэффициент текущей ликвидности (Current Ratio)

Рассчитывается как частное от деления оборотных средств на краткосрочные обязательства и показывает, достаточно ли у предприятия средств, которые могут быть использованы для погашения краткосрочных обязательств. Согласно международной практике, значения коэффициента ликвидности должны находиться в пределах от единицы до двух (иногда до трех). Нижняя граница обусловлена тем, что оборотных средств должно быть, по меньшей мере, достаточно для погашения краткосрочных обязательств, иначе компания окажется под угрозой банкротства. Превышение оборотных средств над краткосрочными обязательствами более чем в три раза также является нежелательным, поскольку может свидетельствовать о нерациональной структуре активов.

Рассчитывается по формуле:

II. Gearing ratios — Показатели структуры капитала (коэффициенты финансовой устойчивости)

Показатели структуры капитала отражают соотношение собственных и заемных средств в источниках финансирования компании, то есть характеризуют степень финансовой независимости компании от кредиторов. Это является важной характеристикой устойчивости предприятия. Для оценки структуры капитала чаще всего используется коэффициент финансовой независимости (Equity to Total Assets), характеризующий зависимость фирмы от внешних займов. Чем ниже значение коэффициента, тем больше займов у компании, тем выше риск неплатежеспособности. Низкое значение коэффициента отражает также потенциальную опасность возникновения у предприятия дефицита денежных средств. Интерпретация этого показателя зависит от многих факторов: средний уровень этого коэффициента в других отраслях, доступ компании к дополнительным долговым источникам финансирования, особенности текущей производственной деятельности.

Рассчитывается по формуле:

Другие показатели, как-то: Profitability ratios — Коэффициенты рентабельности, Activity ratios — Коэффициенты деловой активности, Investment ratios — Инвестиционные критерии, в рамках данной статьи приведены не будут по соображениям раскрытия затронутого вопроса при сжатости материала.

Главное при проведении финансового анализа — не расчет показателей, а умение трактовать полученные результаты. Выводы, однако, не отличаются широтой размаха: основной концептуальный подход базируется на сравнении полученных данных с нормативами, сложившимися в рамках традиционного подхода. Под традиционным подходом, при этом понимается совокупность методов, инструментов и технологий, применяемых для сбора, обработки и интерпретации (истолкования) данных о хозяйственной деятельности компании.

Хотя основной вклад в теорию и практику финансового анализа внесен экономистами стран с развитой рыночной экономикой, необходимо вспомнить и труды советского экономиста 20-х годов Блатова Н., в которых изложены передовые для своего времени понятия и методы анализа: сравнительный аналитический баланс, коэффициенты распределения, коэффициенты координации и др.

Интересен момент заимствования и, в определенной степени, интерпретации «экстремальных значений» аналитических коэффициентов, характеризующих платежеспособность и финансовую устойчивость, с всеобъемлющим их распространением.

Так, в одном из разделов работы Соколова Я.В., написанном совместно с Ковалевым В.В., находим описание интерпретации западной учетно-аналитической практики к российской специфике. При этом приводятся сведения о финансовом состоянии десяти крупных акционерных обществ России по итогам работы 1907, 1908 годов:

«АО «Кавказъ и Меркурий» (пароходная компания), Богородско-Глуховская мануфактура, Фирма «Проводникъ» (резиновое и телеграфное производство), Товарищество М.С. Кузнецова (производство фарфоровых изделий), Русское электрическое общество «Вестингаузъ», АО русских электротехнических заводов «Сименс и Галльское», компания «Зингеръ», АО Мальцовских заводов, Брянский рельсопрокатный, железоделательный и механический заводы (АО), Общество Путиловских заводов» /2, с. 280/.

Рассчитывается ограниченный перечень коэффициентов (их перечень приводится выше). Рассчитанные по приведенной выборке (критерий группировки предприятий не указан) средние значения коэффициентов сравниваются с «мировыми» нормативами. При обнаружении их близости, сделан вывод о приемлемости данных значений в отношении сложившегося в стране положения в структуре активов и источников их покрытия /11/.

По настоящее время существует ряд противоречий, обойти которые, на наш взгляд, значит - умолчать о главном.

Обратимся к указаниям (рекомендациям) министерств и иных федеральных органов исполнительной власти по аспекту методических подходов анализа финансового состояния в разрезе приведенных в них коэффициентов. Среди таковых наиболее значимыми являются методики, представленные в ниже приведенных документах:

1. Методические положения по оценке финансового состояния предприятий и установлению неудовлетворительной структуры баланса, утвержденные распоряжением Федерального управления по делам о несостоятельности (банкротстве) предприятий при Госимуществе России от 12 августа 1994 г. № 31-р.

3. Порядок отчетности руководителей федеральных государственных унитарных предприятий и представителей РФ в органах управления открытых акционерных обществ, утвержденный постановлением правительства РФ от 4 октября 1999 г. № 1116.

4. Методические указания по проведению анализа финансового состояния организаций, утвержденные приказом Федеральной службы России по финансовому оздоровлению и банкротству (далее — ФСФО) от 23 января 2001 г. № 16.

5. Правила проведения арбитражным управляющим финансового анализа. Утвержденные постановлением Правительства РФ от 25 июня 2003 г. № 367. Данные правила в соответствии с Федеральным законом от 26 октября 2002 г. № 127 ФЗ «О несостоятельности (банкротстве)» определяют принципы и условия проведения арбитражным управляющим финансового анализа, а также состав сведений, используемых при этом.

6. Указания о порядке составления и представления бухгалтерской отчетности, утвержденные приказом Минфина России от 22 июля 2003 г. № 67н.

7. Постановление Правительства Российской Федерации от 30 января 2003 года № 52 «О реализации Федерального закона «О финансовом оздоровлении сельскохозяйственных товаропроизводителей».

Обзор указанных документов продемонстрировал полное отсутствие каких-либо отраслевых разграничений анализируемых предприятий. Между тем, следует помнить, что допустимые значения показателей могут существенно отличаться не только для разных отраслей, но и для разных предприятий одной отрасли и полную картину финансового состояния компании можно получить только анализируя всю совокупность финансовых показателей с учетом особенностей ее деятельности. Утвержденные же значения показателей носят чисто информационный характер и не могут быть использованы как руководство к действию. В этой связи требуется разработка нормативной базы на уровне постановлений Правительства или министерств и ведомств в отраслевом разрезе.

Отличительными особенностями современных предприятий АПК являются недостаток оборотного капитала, низкая платежеспособная дисциплина, рост объемов бартерных операций, высокая стоимость кредитных ресурсов. В результате действия этих и других факторов предприятия не имеют средств для выполнения своих платежных обязательств, в том числе выплаты заработной платы, оплаты товаров (работ, услуг), растут долги перед бюджетом.

В то же время, даже находясь в столь тяжелейших условиях, многие предприятия остаются «на плаву». А потому «экстремальные» значения показателей, характеризующих структуру актива и пассива баланса, платежеспособность и финансовую устойчивость организаций, должны учитывать особенности сложившейся ситуации и те границы, внутри которых менеджмент предприятия еще способен разработать стратегические шаги по выходу из кризиса, не доводя дело до процедуры банкротства.

Критерии, действующие для сельскохозяйственных предприятий Соединенных Штатов (коль мы встали на путь заимствования англо-американской финансовой модели) также далеки от российской специфики. Это происходит, прежде всего по двум причинам: во-первых, условия экономики российского сельхозпроизводства сильно отличаются от экономических условий Соединенных Штатов или Канады; во –вторых, отличительной чертой отечественной политики и сельского хозяйства является тот факт, что — особенно среди малых сельхозпредприятий — экономические трудности начинают принимать социальный характер. Таким образом, нарушаются принципы рыночной экономики.

По нашему мнению, главное внимание при адаптации традиционного подхода должно быть сосредоточено на закрытии существующих лакун при проведении процедур финансового анализа.

Основные предложения по дальнейшей разработке заключительных процедур финансового анализа сводятся к:

Расчету собственных нормативов или оптимальных уровней финансовых коэффициентов для анализируемой компании с помощью известных методических приемов;

Выделению узкой (<индикаторной>) выборки финансовых коэффициентов, состав которой может различаться для различных организаций;

Качественной оценке и определению весов индикаторных показателей исходя из сопоставления с расчетными оптимальными уровнями, тенденциями изменения, взаимного сравнения и принятых логических правил;

Разработке типового формата заключения о финансовой деятельности компании, в котором не только констатируются проблемы анализируемой компании, но и указываются факторы происходящих и будущих изменений, а также вносятся рекомендации по их преодолению, смягчению или усилению.

Список литературы

1. Бочаров, В.В. Финансовый анализ/В.В. Бочаров. — СПб: Питер, 2007. -204 с.

2. Васильева, Л.С. Финансовый анализ /Л.С. Васильева, М.В. Петровская.- 3-е изд.– М.: КНОРУС, 2008. — 816 с.

3. Ефимова, О.В. Финансовый анализ/О.В. Ефимова.-5-е изд., перераб. и доп. — М.: Бухгалтерский учет, 2006.-528 с

4. Ендовицкий Д.А.. Диагностический анализ финансовой несостоятельности организаций: учеб. пособие/ Д.А. Ендовицкий, М.В. Щербаков.- М.: Экономистъ, 2007. -287 с.

5. Методика расчета показателей финансового состояния сельскохозяйственных товаропроизводителей: утв. постановлением Правительства РФ от 30 января 2003 г. № 52- М.: Финансы и статистика, 2004.- 2 с.

6. Морозова В.Л. Исторический опыт, или эволюционное развитие экономического анализа хозяйственной деятельности в России с позиций экстернализма/В.Л. Морозова//Экономический анализ: теория и практика.- 2007.-№ 16(97). — С. 60-68.

7. Налоговый кодекс Российской Федерации (часть 2): глава 26 1 . Система налогообложения для сельскохозяйственных товаропроизводителей (единый сельскохозяйственный налог). – Справочная правовая система «Гарант»

8. О развитии сельского хозяйства: федеральный закон Российской Федерации от 29 декабря 2007 г. № 264-ФЗ

9. Савицкая, Г.В. Анализ хозяйственной деятельности предприятий АПК: учеб. пособие/Г.В. Савицкая. — 5-е изд., испр. и доп.- Мн.: Новое знание, 2005 г.

10. Кубышкин И. Использование финансового анализа для управления компанией/ Кубышкин И.//Финансовый директор. — 2005. -№ 4

11. Соколов Я.В. Бухгалтерский учет от истоков до наших дней/ Соколов Я.В. — М.: Аудит. ЮНИТИ. 1996.

12. Зимин Н.Е. Анализ и диагностика финансово-хозяйственной деятельности предприятия/Н.Е. Зимин, В.Н. Солопова. М.: КолосС, 2005 -384 с.

13. Войтоловский Н.В. Экономический анализ: Основы теории. Комплексный анализ хозяйственной деятельности организации: Учебник / Войтоловский Н.В., Калинина А.П., Мазурова И.И. — М.: Высшее образование, 2005. — 509с

Предположим, у вас есть большой набор утверждений (напр., «человек — это звучит гордо», «все люди — сёстры», «худой мир лучше доброй ссоры» и пр.), своё отношение к которым респонденты оценивали по одинаковому шаблону (напр., «согласен / не знаю / не согласен»). Можно, конечно, в статье дать таблички по каждому пункту, но можно попытаться найти что-то, что объединяет одну часть пунктов в более общую категорию, другую — в ещё одну категорию (безусловно, может оказаться и так, что ваши утверждения ничего не объединяет). Факторный анализ — это один из инструментов, который позволяет найти это общее, если оно там, конечно, есть.

Говоря более строго, если оценки двух и более пунктов коррелируют между собой, то логично предположить, что эта корреляция указывает на некий общий фактор (например, высокие оценки у школьников по алгебре и высокие оценки по геометрии скорее всего будут встречаться одновременно и указывать на хорошее абстрактное мышление и развитую логику). Факторный анализ помогает найти эти связи в массиве ваших данных.

Это одновременно сильное и слабое место. Сильное потому, что большой массив данных упрощается и его легче анализировать. А слабое потому, что сильная корреляция, как известно, не указывает на причинность и реальные связи — компьютер покажет вам нечто, но что это значит, насколько находка разумна и правдоподобна, судить только вам. Как написано в одной умной книге «to interpret the factors, which is more like voodoo than science».

Однако перейдём к примеру.

Итак, в 2013 г. Центр социальных экспертиз по заказу ВОО «Гей-Альянс Украины» опрашивал обычных людей (800 чел.) на предмет гомофобии (отчёт). Среди прочего, в опроснике фигурировали и пункты, к гомофобии прямого отношения не имеющие, напр. о доверии к разнообразным политическим и социальным институтам. Вопрос звучал так: «Какой уровень Вашего доверия к следующим социальным институтам? (Дайте один наиболее подходящий ответ по каждой строке)» с вариантами ответов «5. Совсем не доверяю — 4. Скорее не доверяю — 3. Трудно сказать, доверяю или нет — 2. Скорее доверяю — 1. Полностью доверяю». Список институтов, к которым респондент выражал своё отношение, таков:

1. Семье и родственникам
2. Соседям
3. Коллегам
4. Церкви и духовенству
5. Астрологам
6. Средствам массовой информации (телевидение, радио, газеты)
7. Политическим партиям
8. Налоговой инспекции
9. Милиции
10. Прокуратуре
11. Судам
12. Президенту
13. Верховной Раде
14. Правительству
15. Местным органам власти
16. Банкам
17. Страховым компаниям
18. Благотворительным фондам, общественным организациям

Как провести факторный анализ этих данных? (предположим, что таблица с ответами называется dovira)
Присоединяем массив:

>attach(dovira)

Вначале следует убедиться, что в загруженном массиве нет пропусков и ошибок ввода:

>which(is.na(dovira)==T)
integer(0)
>summary(dovira)
p1
Min. :1.000
1st Qu.:2.000
Median:2.000
Mean:2.711
3rd Qu.:4.000
Max. :5.000 ... ... ...

Как видим, всё в порядке (для того, чтобы не загромождать изложение, в выводе оставлен только первый вопрос).
Команда, выполняющая факторный анализ, входит в набор пакетов, устанавливаемых по умолчанию. Она очень проста:

>factanal(dovira,6)
Call:
factanal(x = dovira, factors = 6)

Uniquenesses:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.431 0.195 0.379 0.614 0.047 0.672 0.506 0.285 0.174 0.106 0.186 0.215 0.112 0.082 0.464 0.288 0.204 Factor1 Factor2 Factor3 Factor4 Factor5 Factor6
1 -0.407 -0.324 0.489 -0.106 -0.213
2 0.879 0.131 -0.112
3 0.784
4 -0.128 0.540 -0.170 0.193
5 0.125 0.171 0.133 0.943
6 0.265 0.122 0.252 0.393 0.139
7 0.522 0.382 0.148 0.151 0.175
8 0.395 0.673
-0.119 0.204 0.182 0.131
9 0.329 0.817 0.181
10 0.297 0.865 -0.113 0.145 0.122
11 0.353 0.769 -0.104 0.277
12 0.805 0.320 0.111
13 0.853 0.318 -0.144 0.151 0.121
14 0.902 0.250 0.125
15 0.582 0.230 0.181 0.325
16 0.196 0.414 0.667 0.139 0.184
17 0.243 0.351 0.694 0.160 0.317
18 0.162 0.109 0.228 0.608
Factor1 Factor2 Factor3 Factor4 Factor5 3.662 3.399 2.079 0.324 1.275 0.765
ProportionVar 0.203 0.189 0.116 0.074 0.071 0.043
CumulativeVar 0.203 0.392 0.508 0.581 0.652 0.695
Test of the hypothesis that 6 factors are sufficient.
The chi square statistic is 257.27 on 60 degrees of freedom.
The p-value is 2.95e-26

Посмотрим на результаты.

Вначале в выводе повторяется отданная машине команда, потом идёт табличка «уникальностей», т. е. долей общей дисперсии, вносимых каждой переменной по отдельности. Следом мы видим таблицу нагрузок, в которой столбцы соответствуют коэффициентам корреляции отдельных переменных с выделенными факторами. Наконец, третья таблица — доля общей дисперсии, объясняемой каждым конкретным фактором и накопление этих дисперсий. Завершает вывод информация о тестировании гипотезы «выбранное число факторов достаточно для описания массива».

Наиболее важными являются таблицы нагрузок и долей объясняемой дисперсии.

Из последней видно, что в сумме 6 выделенных факторов объясняют 70% разброса данных, при этом первый фактор отвечает за пятую часть суммарной дисперсии, второй — 19%, третий — 12% и т. д.
Таблица нагрузок указывает, что в первом факторе объединены 7, 12, 13, 14 и 15 институция (коэффициенты корреляций больше 0.5), во втором — 8, 9, 10, 11, в третьем — 2, 3, 4 и т. д.

Попробуем интерпретировать результаты.

Фактор 1 объединяет доверие к политическим партиям, президенту, Верховной Раде, правительству и к местным органам власти. Иными словами, это доверие к политической сфере в целом .
Фактор 2 объединяет доверие к налоговой инспекции, милиции, прокуратуре и судам. Иными словами, это доверие к фискальным и силовым органам .
Фактор 3 объединяет доверие к соседям, коллегам и, неожиданно, к церкви и духовенству. Эти институции можно обобщить следующим образом — доверие к людям, с которыми респонденты встречаются лицом к лицу . В пользу этого говорит и корреляция с уровнем доверия к родственникам (она лишь ненамного ниже, чем произвольно избранный нами порог коэффициента корреляции 0.5).
Фактор 4 — это доверие к банкам и страховым компаниям, т. е. к финансовым учреждениям .
Фактор 5 стоит особняком — доверие к астрологам (других заметных корреляций нет).
Фактор 6 подобно предыдущему коррелирует только с уровнем доверия только к одной институции — благотворительные фонды и общественные организации .
Лишь одна институция не вошла в эти факторы — средства массовой информации (телевидение, радио, газеты). Доверие к ней приблизительно одинаково «размазано» по выделенным факторам.

Что нам дают эти результаты?

Если мы уровень доверия к социальным институтам усредним по факторам (т. е. для каждого респондента просуммируем баллы институций, вошедших в фактор, и поделим на число этих объединённых фактором институций), то получим картинку настроений украинцев в отношении отдельных элементов государства и общества:

Видно, что больше всего у респондентов доверия к людям, с которыми они встречаются лицом к лицу. А меньше всего доверия к фискальным и силовым органам, а также к финансовым учреждениям.

Последний аспект, который не может не вызвать вопросов: откуда мы знаем, что факторов нужно выделить именно 6. Самым, пожалуй, точным ответом будет — ниоткуда. Каждый раз, нужно экспериментировать, опираясь на здравый смысл. Во-первых, количество факторов не может быть большим, чем число переменных. Во-вторых, можно ориентироваться на суммарную объясняемую дисперсию, ибо нет смысла рассуждать о факторах, если они в совокупности не описывают хотя бы её половину (а умные люди рекомендуют добиваться по крайней мере 70%). В-третьих, нужно ориентироваться на возможность подобрать разумное объяснение полученным факторам.

В этом очерке мы не касались многих важных аспектов факторного анализа, напр. таких, как методы вращения. Наша цель состояла в том, чтобы в самых общих чертах продемонстрировать зачем нужен этот метод и как его использовать. Более глубокое знакомство, естественно, требует самостоятельной работы с руководствами и данными.

Литература

Teetor P. R Cookbook. — O’Reilly, 2011

Цель проведения тренинга «Анализ данных и моделирование взаимосвязи в пакете R» – изучить базовые возможности программы R – бесплатного языка программирования для проведения статистических вычислений, а также научиться организовывать ввод данных и управлять ими, проводить первичный статистический анализ данных, представлять их в графическом виде, уметь находить взаимосвязи в данных. Обучение рассчитано на слушателей без опыта работы в R или с начальными знаниями пакета.

Слушателям желательно иметь навыки программирования и быть знакомым с основами статистического анализа.

По окончания обучения Вы будете уметь в программе R:

  • Правильно формировать выборку данных для анализа
  • Организовывать ввод данных и управлять данными
  • Выполнять описательный статистический анализ
  • Изучать взаимосвязь в таблицах сопряженности
  • Проверять статистические гипотезы о равенстве средних
  • Использовать графические возможности
  • Проводить корреляционный анализ
  • Проводить регрессионный анализ
  • Проводить дисперсионный анализ

Продолжительность тренинга: 32 ак.ч. или 4 дня.

Программа обучения:

Тема 1. Основные понятия статистического анализа данных – 2 ак.ч.

  • Статистическое исследование
  • Способы получения данных
  • Отличие наблюдения от эксперимента
  • Генеральная совокупность и выборка
  • Требования к данным при формировании выборки
  • Понятие точечной и интервальной статистической оценки
  • Признаки и переменные
  • Шкалы измерения переменных
  • Направления анализ статистических данных
  • Описательная и аналитическая статистика
  • Выбор методов статистического анализа в зависимости от шкал измерения переменных
  • Статистическая гипотеза
  • Виды статистических ошибок
  • Принципы проверки статистических гипотез
  • Выбор уровня значимости при проверке гипотез

Тема 2. Введение в работу в среде R – 2 ак.ч.

  • Особенности работы с R
  • Установка программы
  • Запуск программы
  • Среда R
  • Интерфейс командной строки и диалоговых окон
  • Правила задания команд
  • Создание рабочей директории
  • Пакеты
  • Графические интерфейсы
  • R как калькулятор
  • Справочная система

Тема 3. Основы программирования в R – 2 ак.ч.

  • Виды объектов в R
  • Вектора
  • Списки
  • Матрицы
  • Факторы
  • Таблицы данных
  • Выражения
  • Операторы доступа к данным
  • Функции и аргументы
  • Циклы и условные операторы
  • Управления базами данных в R
  • Векторизация операций
  • Отладка
  • Объектно-ориентированное программирование

Тема 4. Ввод и организация данных в R – 2 ак.ч.

  • Способы загрузки данных
  • Непосредственный ввод данных
  • Ввод данных в таблице
  • Импорт данных из MS Excel
  • Импорт данных из других статистических пакетов и баз данных
  • Сохранение результатов анализа
  • Задание количественных данных
  • Задание порядковых и номинальных данных
  • Задание пропущенных значений в данных
  • Выявление выбросов и ошибок
  • Принципы преобразование данных

Тема 5. Графические возможности R – 2 ак.ч.

  • Графические функции
  • Графические устройства
  • Графические параметры
  • Интерактивная графика
  • Составные изображения
  • Устройства вывода

Тема 6. Описательный статистический анализ в R – 4 ак.ч.

  • Статистики центральной тенденции
  • Средняя арифметическая
  • Модальное значение
  • Медианное значение
  • Статистики разброса
  • Дисперсия и стандартное отклонение
  • Коэффициент вариации
  • Процентили
  • Гистограммы
  • Ящичковые диаграммы
  • Z-преобразование
  • Нормальный закон распределения
  • Асимметрия и эксцесс
  • Проверка распределения на нормальность
  • Некоторые законы распределения
  • Биномиальное распределение
  • Распределение Пуассона
  • Равномерное распределение
  • Экспоненциальное распределение
  • Логнормальное распределение
  • Стандартная ошибка и интервал для средней

Тема 7. Формирование данных для анализа выборочным методом – 2 ак.ч.

  • Генеральная и выборочная совокупность
  • Характеристики выборки
  • Особенности выборочного метода исследования
  • Классификация выборок
  • Виды и методы вероятностного отбора
  • Способы формирования выборок
  • Простой случайный отбор
  • Систематический случайный отбор
  • Кластерный отбор
  • Одноступенчатный кластерный отбор
  • Многоступенчатый кластерный отбор
  • Алгоритм проведения выборочных обследований
  • Определение необходимого объема выборки

Тема 8. Статистические тесты выявления различий в выборках в R – 4 ак.ч.

  • Гипотезы о сравнении средних
  • Z-критерий для сравнения средних
  • Z-критерий для сравнения долей
  • Одновыброчный t-критерий
  • T-критерий для независимых выборок
  • T-критерий для зависимых выборок
  • Условия применения непараметрических критериев
  • Одновыборочный критерий знаковых рангов Вилкоксона
  • Критерий Манна-Уитни
  • Критерий знаков для связанных выборок
  • Критерий знаков Вилкоксона для связанных выборок
  • Непараметрический дисперсионный анализ Крускала-Уоллиса
  • Критерий Фридмана для зависимых выборок

Тема 9. Оценка взаимосвязи между переменными в R – 4 ак.ч.

  • Анализ взаимосвязи между категориальными переменными
  • Таблицы сопряженности
  • Ожидаемые частоты и остатки в таблицах сопряженности
  • Критерий хи-квадрат
  • Критерий согласия
  • Классификация видов взаимосвязи между количественными переменными
  • Диаграммы рассеяния
  • Предпосылки и условия проведения корреляционного анализа
  • Коэффициент корреляции Пирсона
  • Ранговые коэффициенты корреляции
  • Коэффициент корреляции Спирмена
  • Проверка значимости связи
  • Интервальные оценки коэффициентов корреляции
  • Частные коэффициенты корреляции

Тема 10. Моделирование формы связи с помощью регрессионного анализа в R– 4 ак.ч.

  • Основные понятия регрессионного анализа
  • Парная и множественная линейная модель регрессии
  • Предпосылки линейного регрессионного анализа
  • Оценка коэффициентов регрессии
  • Проверка обоснованности модели регрессии
  • Значимость уравнения регрессии
  • Значимость коэффициентов регрессии
  • Отбор переменных в регрессионном анализе
  • Оценка точности уравнения регрессии
  • Оценка статистической устойчивости уравнения регрессии
  • Точечная и интервальная оценка зависимой переменной
  • Нелинейные регрессионные модели
  • Категориальные независимые переменные в модели регрессии

Тема 11. Моделирование взаимосвязи с помощью дисперсионного анализа в R– 4 ак.ч.

  • Модели дисперсионного анализа
  • Предпосылки применения дисперсионного анализа
  • Проверка гипотезы о равенстве дисперсий
  • Модель однофакторного дисперсионного анализа
  • Таблица однофакторного дисперсионного анализа
  • Оценка степени влияния фактора
  • Апостериорные критерии парных сравнений
  • Дисперсионный анализ с двумя и более факторами
  • Таблица двухфакторного дисперсионного анализа с взаимодействием
  • Графическая интерпретация взаимодействия факторов
  • Анализ многофакторной модели

Сегодня я немного расскажу о решении задачи классификации с использованием программного пакета R и его расширений. Задача классификации, пожалуй, одна из самых распространенных в анализе данных. Существует множество методов для ее решения с использованием разных математических техник, но нас с тобой, как апологетов R, не может не радовать, что при этом программировать что-либо с нуля не нужно, - все есть (причем далеко не в единственном экземпляре) в системе пакетов R.

Задача классификации

Задача классификации - типичный пример «обучения с учителем». Как правило, мы располагаем данными в виде таблицы, где столбцы содержат значение наборов признаков для каждого случая. Причем все строки заранее размечены таким образом, что один из столбцов (положим, что последний) указывает на класс, к которому принадлежит данная строка. Как хороший пример можно привести задачу классификации писем на спам и не спам. Для того чтобы воспользоваться алгоритмами машинного обучения, нужно для начала иметь размеченные данные - такие, для которых значение класса известно наряду с остальными признаками. Причем набор данных должен быть существенным, особенно если количество признаков велико.

Если у нас есть достаточно данных, то можно начинать обучение модели. Общая стратегия с классификаторами не особо зависит от модели и включает следующие шаги:

  • выбор тренировочного и тестового множества;
  • обучение модели на тренировочном множестве;
  • проверка модели на тестовом множестве;
  • перекрестная проверка;
  • улучшение модели.

Точность и полнота

Как оценить, насколько хорошо работает наш классификатор? Непростой вопрос. Дело в том, что различные варианты развития событий возможны, даже если у нас есть всего только два класса. Допустим, мы решаем задачу фильтрации спама. После проверки модели на тестовом множестве мы получим четыре величины:

TP (true positive) - сколько сообщений было правильно классифицировано как спам,
TN (true negative) - сколько сообщений было правильно классифицировано как не спам,
FP (false positive) - сколько сообщений было неправильно классифицировано как спам (то есть письма спамом не были, но модель классифицировала эти сообщения как спам),
FN (false negative) - сколько сообщений было неправильно классифицировано как не спам, а на самом деле это был все-таки Центр американского английского.

Продолжение доступно только участникам

Вариант 1. Присоединись к сообществу «сайт», чтобы читать все материалы на сайте

Членство в сообществе в течение указанного срока откроет тебе доступ ко ВСЕМ материалам «Хакера», увеличит личную накопительную скидку и позволит накапливать профессиональный рейтинг Xakep Score!

Random Forest - один из моих любимых алгоритмов data mining. Во-первых он невероятно универсален, с его помощью можно решать как задачи регрессии так и классификации. Проводить поиск аномалий и отбор предикторов. Во-вторых это тот алгоритм, который действительно сложно применить неправильно. Просто потому, что в отличии от других алгоритмов у него мало настраиваемых параметров. И еще он удивительно прост по своей сути. И в то же время он отличается удивительной точностью.

В чем же идея такого замечательного алгоритма? Идея проста: допустим у нас есть какой-то очень слабый алгоритм, скажем, . Если мы сделаем очень много разных моделей с использованием этого слабого алгоритма и усредним результат их предсказаний, то итоговый результат будет существенно лучше. Это, так называемое, обучение ансамбля в действии. Алгоритм Random Forest потому и называется "Случайный Лес", для полученных данных он создает множество деревьев приятия решений и потом усредняет результат их предсказаний. Важным моментом тут является элемент случайности в создании каждого дерева. Ведь понятно, что если мы создадим много одинаковых деревьев, то результат их усреднения будет обладать точностью одного дерева.

Как он работает? Предположим, у нас есть некие данные на входе. Каждая колонка соответствует некоторому параметру, каждая строка соответствует некоторому элементу данных.

Мы можем выбрать, случайным образом, из всего набора данных некоторое количество столбцов и строк и построить по ним дерево принятия решений.


Thursday, May 10, 2012

Thursday, January 12, 2012


Вот собственно и всё. 17-ти часовой перелет позади, Россия осталась за океаном. А в окно уютной 2-ух спальной квартиры на нас смотрит Сан-Франциско, знаменитая Кремниевая долина, Калифорния, США. Да, это и есть та самая причина, по которой я практически не писал последнее время. Мы переехали.

Всё это началось еще в апреле 2011 года, когда я проходил телефонное интервью в компании Zynga. Тогда это все казалось какой-то игрой не имеющей отношения к реальности и я и представить себе не мог, во что это выльется. В июне 2011 года Zynga приехали в Москву и провели серию собеседований, рассматривалось около 60 кандидатов прошедших телефонное интервью и из них было отобрано около 15 человек (точное число не знаю, кто-то потом передумал, кто-то сразу отказался). Интервью оказалось неожиданно простым. Ни тебе задачек на программирование, ни заковыристых вопросов про форму люков, в основном проверялись способности болтать. А знания, на мой взгляд, оценивались лишь поверхностно.

А дальше началась канитель. Сначала мы ждали результатов, потом офера, потом одобрение LCA, потом одобрения петиции на визу, потом документы из США, потом очередь в посольстве, потом дополнительную проверку, потом визу. Временами мне казалось, что я готов все бросить и забить. Временами я сомневался, а нужна ли нам эта Америка ведь и в России не плохо. Весь процесс занял где-то около полугода, в итоге, в середине декабря мы получили визы и начали готовиться к отъезду.

В понедельник был мой первый рабочий день на новом месте. В офисе созданы все условия для того чтобы не только работать, но и жить. Завтраки, обеды и ужины от собственных поваров, куча разнообразнейшей еды распиханной по всем уголкам, спортзал, массаж и даже парикмахер. Все это совершенно бесплатно для сотрудников. Многие добираются на работу на велосипеде и для хранения транспорта оборудовано несколько комнат. В общем, ничего подобного в России мне встречать не доводилось. Всему, однако, есть своя цена, нас сразу предупредили, что работать придется много. Что такое "много", по их меркам, мне не очень понятно.

Надеюсь, однако, что несмотря на количество работы, в обозримом будущем смогу возобновить ведение блога и, может быть, расскажу что-нибудь о американской жизни и работе программистом в Америке. Поживем - увидим. А пока, поздравляю всех с наступившим новым годом и рождеством и до новых встреч!


Для примера использования, распечатаем дивидендную доходность российских компаний. В качестве базовой цены, берем цену закрытия акции в день закрытия реестра. Почему-то на сайте тройки этой информации нет, а она ведь гораздо интересней чем абсолютные величины дивидендов.
Внимание! Код выполняется довольно долго, т.к. для каждой акции требуется сделать запрос на сервера finam и получить её стоимость.

Result <- NULL for(i in (1:length(divs[,1]))){ d <- divs if (d$Divs>0){ try({ quotes <- getSymbols(d$Symbol, src="Finam", from="2010-01-01", auto.assign=FALSE) if (!is.nan(quotes)){ price <- Cl(quotes) if (length(price)>0){ dd <- d$Divs result <- rbind(result, data.frame(d$Symbol, d$Name, d$RegistryDate, as.numeric(dd)/as.numeric(price), stringsAsFactors=FALSE)) } } }, silent=TRUE) } } colnames(result) <- c("Symbol", "Name", "RegistryDate", "Divs") result


Аналогично можно построить статистику для прошлых лет.