Гибридное типирование в соционике
Каждый, кто более-менее регулярно занимался типированием по анкетам, сталкивался с двумя проблемами: ограниченная пропускная способность типировщика, который может разбирать только несколько анкет в день, и «эффект Тени», когда рассматривается несколько соседних типов, но ни один не подходит полностью, а правильным в итоге оказывается такой вариант, которые даже не рассматривался (например, из-за того, что один из признаков определен неправильно, или же просто потому что данный ТИМ остался за рамками внимания типировщика).
Также было замечено, что произвести проверку, соответствует ли типируемый конкретному ТИМу существенно проще, чем определять тип «с нуля». В результате возникла идея создать методику типирования, в соответствии с которой сначала в результате формального анализа анкеты определяется несколько наиболее вероятных типов с помощью компьютера, а затем уже типировщик по развернутым ответам на анкету проверяет предложенные варианты (или рассматривает другие в случае необходимости).
Такая методика получила название гибридного типирования, так как она позволяет сочетать в себе преимущества и тестов (простота и быстрая выдача правильного результата) и анкетного типирования (типируемый может развернуто пояснять свои ответы, и то, как он понял вопрос). Кроме того, типируемый может сразу высказать свое мнение о предложенных ему автоматическим анализом типах, что даст типировщику дополнительную информацию.
Для реализации идеи гибридного типирования на сайте TIPIRUEM.RU в 2010 году была создана анкета №2, содержавшая 18 вопросов, два из которых были общего плана, а остальные – на связки из двух аспектов, которые могут находиться в одном блоке модели А (т.е. БЛ+ЧИ, БЛ+ЧС, БИ+ЧЭ, БИ+ЧЛ и т.д.). В каждом из этих вопросов типируемому предлагалось развернуто описать, как он будет действовать в той или иной ситуации, связанной с соответствующими аспектами, а затем дать оценку своих способностей в соответствующей области по шкале от -2 до 2.
За период с октября 2010 года по май 2012 было собрано более 100 анкет с такими ответами, анализ которых проводился вручную (обычное анкетное типирование). Это позволило собрать необходимую статистику по ответам представителей различных ТИМов и приступить к созданию методики формального анализа анкеты на основе сравнения с уже имеющимися ответами (т.е. по сути дела, нейронной сети с обучением в ручном режиме). При этом была выявлена следующая проблема: ответы давались на основе субъективной оценки человеком своих способностей в той или иной области, и на них серьезное влияние оказывала общая самооценка человека. Если она была существенно завышена или занижена, ответы могли существенно отличаться от характерных для представителей данного типа. Вторым фактором явилось то, что многие люди неохотно пользуются отрицательными числами при оценке.
В результате были введены два этапа коррекции ответов типируемых. Если представить все ответы типируемых как вектор X={xi}, где xi — ответ на i-ый вопрос (i – от 3 до 18 в соответствии с нумерацией вопросов в анкете), то на первом этапе коррекции определяется среднее арифметическое по всем ответам Xсред и вычитается из каждого ответа:
Xk1={xi-Xсред}
На втором этапе производится приведение всех ответов к единому масштабу в диапазоне от -2 до +2 (что позволяет скорректировать ситуацию, когда типируемый дает больше положительных ответов, чем отрицательных).
Для этого определим корректировочный коэффициент:
Ккорр=2/max(|xk1 i|)
И проведем корректировку следующим образом
Xk2={xk1 i*Kкорр}
Следует отметить, что при всех одинаковых ответах xi вектор Xk1 скорректированных на первом этапе значений станет нулевым (т.к. Xсред=xi , следовательно xk1 i=Xсред-xi=0), и на этапе второй корректировки возникнет деление на ноль, что вполне соответствует здравому смыслу: при всех одинаковых ответах ТИМ определить невозможно.
Изначально предполагалось расставить ответы из обработанных анкет в соответствие с функциями модели А и определить на основе средних значений эталонные коэффициенты для каждой связки функций Xэталон. Далее расставлять ответы типируемого в соответствие с функциями каждого ТИМа по модели А и определить тип по сумме квадратов разности между ответами самого типируемого и эталонными коэффициентами:
Sj=∑(Xk2 R[i, j]-Xэ i)2, (суммирование ведется по i, где i – номера всех возможных блоков в модели А)
где j – рассматриваемый ТИМ, Si – коэффициент отклонения ответов типируемого от эталонных, а Ri, j — матрица расстановок, позволяющая выбрать из набора ответов типируемого ответы по тем аспектам, которые находятся в i-ом блоке модели А (т.е. например, для блока Эго, т.е. связки I+II для типа ИЛЭ будет выбран ответ 8 по ЧИ+БЛ, для типа СЭИ – ответ 9 по БС+ЧЭ и т.д.)
Однако когда эта методика была реализована и испытана на практике (т.е. на новых, еще не внесенных в качестве образцов анкетах), количество ошибок оказалось просто огромных (более 50%). По всей видимости, объяснялось это «неоднородностью» ответов, т.е. тем, что по некоторым вопросам представители почти всех ТИМов давали не сильно различающиеся ответы. Наиболее показательным оказался в этом плане вопрос 18, изначально ориентированный на связку БИ+ЧЭ: положительная средняя оценка по нему оказалась только у двух ТИМов: ИЛИ – «Бальзак» и СЛИ – «Габен».
В результате была создана другая методика анализа: все ответы из анкет-образцов после двух описанных выше корректировок группировались в соответствии с определенным ТИМом, и свой вектор эталонных коэффициентов Xэт j составлялся для каждого из ТИМов (в качестве каждого элемента вектора бралось среднее значение ответов представителей j-го ТИМа на i-ый вопрос).
Xэт j={ ∑Xk2i, l/Nj } (суммирование ведется по l),
где Nj – количество представителей j-ого ТИМа, l – номер текущего типируемого j-ого типа, принимает значения от 1 до Nj, xk2 i, l – i-ый ответ l-ого типируемого после двух этапов коррекции.
Далее вектор ответов типируемого Xk2 сравниваются с эталонным вектором Xэт j каждого ТИМа: рассчитывается квадрат расстояния между этими векторами:
Sj=∑(Xi-Xэт j, i)2 (суммирование ведется по I, где I принимает значения от 3 до 18 в соответствии с номерами вопросов в анкете).
Те три ТИМа, для которых Sj будет иметь наименьшие значения, будут рассматриваться типировщиком в качестве возможных вариантов в первую очередь. В случае, если окажется, что ни один из них не подходит, анкета рассматривается обычным образом «с нуля».
Вторая методика анализа позволила обойти проблему «неравномерности» вопросов и получить значительно более точные результаты, чем первая. Тем не менее, в ходе практических испытаний выявлена еще одна систематическая закономерность: обладатели первой Воли по психософии более тщательно прикрывают свой блок СуперЭго, из-за чего оказываются протипированными неправильно.
В настоящий момент вторая методика автоматического анализа анкеты реализована в виде XLS-файла, доступного для скачивания по адресу http://tipiruem.ru/download/hybrid.xls. Эта методика может использоваться как в рамках гибридного типирования на основе анкеты №2, так и в качестве независимого соционического теста при условии, что типируемый способен самостоятельно определить, какой из предложенных трех ТИМов ему подходит. Важно отметить, что при использовании в качестве теста без анкеты точность будет ниже, так как типируемый не настраивается на соответствующие аспекты и не может указать в развернутом ответе то, как он понял данный вопрос и исходя из чего дал именно такой ответ.
Кроме того, следует учитывать, что на ответы, кроме соционического типа, будет влиять еще и психософский, а там другие факторы. В связи с этим целесообразно в дальнейшем провести еще одно усовершенствование методики – выделение групп сходных результатов (кластеров) внутри ответов каждого ТИМа и составление эталонных векторов для каждого кластера. Это позволит не только повысить точность типирования, но и возможно, определить какие-то дополнительные факторы, например, подтипы или положение психософских функций.