автореферат и диссертация по педагогике 13.00.02 для написания научной статьи или работы на тему: Методика изучения достоверности и обобщаемости тестов по IELTS как форма оценки знаний в образовательной системе Ирана
- Автор научной работы
- Шакибои Гударз
- Ученая степень
- кандидата педагогических наук
- Место защиты
- Душанбе
- Год защиты
- 2014
- Специальность ВАК РФ
- 13.00.02
Автореферат диссертации по теме "Методика изучения достоверности и обобщаемости тестов по IELTS как форма оценки знаний в образовательной системе Ирана"
На правах рукописи
ШАКИБОИ ГУДАРЗ
МЕТОДИКА ИЗУЧЕНИЯ ДОСТОВЕРНОСТИ И ОБОБЩАЕМОГО! ТЕСТОВ ПО 1ЕЫ$ КАК ФОРМА ОЦЕНКИ ЗНАНИЙ В ОБРАЗОВАТЕЛЬНОЙ СИСТЕМЕ ИРАНА 13.00.02 - теория и методика обучения и воспитания (методика преподавания иностранного языка - педагогические науки)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата педагогических наук
ДУШАНБЕ-2014
005546926
005546926
развития образования Академии
Работа выполнена в Институте образования Таджикистана
Научный руководитель: Официальные оппоненты:
Ведущая организация:
Джамшедоп Марпоиахои- доктор филологических наук, академик АПСН РФ, профессор (РТСУ)
Алиев Сулпймон Иознмопнч
докторпедагогических наук, профессор (ТГТ1У им.С.АЙни)
Напрасоп Абдурауф Бурхонопич -
кандидат педагогических наук, доцент (ТГИЯ им, С.Улупода)
Таджикский национальный университет
Защита состоится «22» февраля 2014г. в 9.00 часов на заседании диссертационного совета Д.047.016.01 по присуждению ученой степени доктора и кандидата педагогических наук по специальности 13.00,02 - теория и методика обучения и воспитания (методика преподавания иностранного языка -педагогические науки) при Академии образования Таджикистана (734024, г. Душанбе, ул. Айни, 45)
С диссертацией можно ознакомиться в библиотеке Академии образования Таджикистана.
Тгкет автореферата размещён па официальном сайте ВАК Мипобрнауки РФ -wwwreferatvak @ mon.ciov, а также на сайте Академии образования Таджикистана - www.aot.ti
Автореферат разослан «21» января 2014 г.
Ученый секретарь диссертационного совета доктор педагогических наук,
профессор J I Негматов С.Э.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы исследования
Социально-экономические трансформации и позитивные преобразования 21 века, бурное развитие науки и техники обусловили повышенный интерес к процессам иноязычного образования и методики преподавания. Это явление характерно для всех государств, в том числе Ирана: формирующийся в настоящее время рынок труда диюует новые требования к качеству и уровню профессиональной подготовки высокообразованных и компетентных специалистов, способных найти применение своих знаний и умений в различных сферах государственной и общественной деятельности.
Английский язык становится важной составляющей успеха в любой сфере общественной и межгосударственной деятельности. Если прежде иностранный язык изучался, главным образом, лишь как школьный предмет, то сегодня, уровень знаний по английскому языку соответствует уровню развития человека - как интеллектуального, так и материального.
В действующих учебниках иностранного языка заметно повысилось их качество: значительно изменена структура и содержание предмета, усилен методический аппарат. Вопросы и задания стали больше соответствовать их назначению, стало больше вопросов, развивающих речь и когнитивную деятельность обучаемых. С улучшением отбора и расположения учебного материала в учебниках, повысился интерес учащихся к учебе, усвоению и восприятию иноязычного языкового и текстового материала. Иначе говоря, расширение международного сотрудничества и международных контактов поставили на повестку дня более глубокое владение иностранным языком в образовательном пространстве Ирана.
Контроль и оценка уровня владения иностранным языком являются важнейшим компонентом учебного процесса. Основная задача контроля -объективное определение уровня владения обучаемыми иноязычным материалом на каждом этапе становления их лингвистических и коммуникативных навыков и умений, при этом объектом контроля является как языковая форма сообщения, так и его содержание.
Контроль представляет собой сложное диалектическое целое, в котором тесно переплетаются деятельность учителя и обучаемого. В результате контроля преподаватель:
1) на основе анализа и интерпретации данных получает информацию о качестве своей работы, об эффективности тех или иных приемов обучения;
2) анализирует свою деятельность и своевременно исправляет методические ошибки;
3) правильно планирует процесс обучения, более целенаправленно распределяет учебное время;
4) получает сведения о результатах работы группы обучаемых в целом и каждого обучаемого отдельно, которые могут служить основанием для индивидуализации и дифференциации обучения.
Традиционная система контроля и оценки в силу своих организационных и технологических особенностей не позволяет получить независимую, объективную, сопоставимую информацию о достижениях обучаемых. Одной из . форм контроля, позволяющей измерить уровень обученности, получить,; достоверные, надежные данные и обеспечить объективную оценку, является тест.
Термин «тест» был введен в научный обиход американским психологом Дж. Кеттеллом в 1890 г. для наименования психологических проб, т. е. специально
разработанных стандартизированных методик, с помощью которых пытались измерить различия между индивидами или реакциями одного индивида в разных условиях. Однако ни в психологии, ни в других научных областях (социологии, педагогике, медицине, физиологии, вычислительной технике) все еще нет единого
определения термина.
Слово «тест» в английском языке означает «испытание», «эксперимент», «проверка», «проба». При такой полисемии терминологические неточности очевидны.Иногда тест трактуется чрезвычайно широко: под ним понимаются и простые контрольные работы, и контрольно-тренировочные упражнения, и собственно процесс контроля, а также все взятое вместе.
Настоящее исследование рассматривает аспекты тестов Международной системы тестирования английского языка (ШЬТБ), в том числе, достоверность и обобщаемость, которые являются двумя важными свойствами тестов ГЕЬТв.
Во многих передовых странах мира, в частности, в Австралии, Канаде, Великобритании, США университеты используют ШЬТБ на вступительных экзаменах, так как в будущем кандидаты обязаны будут продолжить обучение в англоязычных странах, где языком обучения для них будет английский язык. В тех ситуациях, когда тесты используются при принятии решения об обучении индивида в национальных и международных университетах, в которых английский язык является языком обучения, достоверность задач и материалов, используемых в тестах ШЬТБ, является совершенно объективной и справедливой. Широкое использование тестов ШЬТБ, используемых в вузах Запада в последние годы, явилось результатом увеличения количества студентов в международных университетах англоязычных стран мира.
Возрастающее влияние тестов ШЬТБ на будущую жизнь кандидатов для продолжения работы и их обучения в англоязычной стране подчёркивает необходимость наличия такого критерия, как достоверность. Другая причина, не менее важная при констатации достоверности - его потенциальное влияние на восприятие теста кандидатами, а, следовательно, и на его результативность.
Другим положительным свойством теста является обобщаемость. Обобщаемость - необходимое свойство тестов ШЬТв. Он помогает определить способность студентов к обучению в университетах на английском языке. Если не определять языковые способности студентов посредством тестирования, в будущем студенты могут не справиться с обучением в университетах, где английский язык является языком обучения. Обобщаемость используется исследователями в академической среде.
Результаты и заключения исследования могут обобщаться на примере населения Поэтому достоверность и обобщаемость являются двумя важными характеристиками тестов [ЕЬТв, и мы считаем необходимым исследование этих двух характеристик, так как если тесты ШЬТв не обобщается, то мы не можем обобщать результаты и заключения на примере населения. С другой страны, если тесты ШЬТБ не являются достоверными, то студенты, которые проходят тест ГЕЬТБ, не смогут использовать все знания, что они изучают в ситуации
реальной жизни.
Степень разработанности исследуемой проблемы
История развития тестов своими корнями уходит далеко в глубь веков. Еще в Древнем Египте, Греции, Китае проводились испытания различных способностей, знаний, умений и навыков. Эти испытания были связаны с определенными измерениями тех или иных качественных результатов человеческой деятельности. Их с полным правом можно считать предысторией тестов По мере развития общественных отношений совершенствовались и
количественные методы измерений, предъявлялись новые требования к проведению экзаменов и выставлению оценок.
В России практическое значение тесты получили после 1925 г., когда была создана особая тестовая комиссия. Она существовала при педагогическом отделе Института методов школьной работы. В ее задачи входила разработка тестов для советской школы. И уже весной 1926 г. вышли такие тесты, созданные на основе американских. Были разработаны тесты по природоведению, обществоведению, счету, решению задач, на понимание чтения и проверку умения правописания. К этим тестам прилагались инструкции и личная карточка для учета прогресса учащегося.
Уже в те годы было доказано, что метод тестов позволяет не только охватить отдельные элементарные психические процессы, но может анализировать их совокупности. Кроме того, было замечено, что тестовый учет устраняет случайность, субъективность и приблизительность оценки работы с учащимися.
Однако вскоре положение кардинально изменилось. Вышедшее в 1936 г. постановление ЦК ВКП (б) негативно сказалось на развитии тестологии. Метод тестов был признан орудием дискриминации учащихся и «изгнан» из советской школы.
Если в отечественной науке исследования в области разработки и применения тестов были приостановлены, то в ряде западных стран они продолжали интенсивно развиваться в различных направлениях. В 30-50-е годы значительное внимание уделялось прогностическим тестам, назначению тестов в системе образования, видам тестов и их использованию в практической деятельности. Особую актуальность в это время приобретают вопросы, связанные с разработкой тестов педагогами-практиками.
Следующим этапом в развитии тестирования в России является период с начала 60-х гг. до конца 70-х гг. Реформы по преподаванию ряда предметов, развитие программированного обучения дали значительный толчок к дальнейшему совершенствованию тестов.
Наряду с этим широко начинает внедряться тестирование с помощью компьютеров, что стало возможным благодаря достижениям в области автоматики и кибернетики. Возникновение кибернетики способствовало исследованию обратной связи в обучении. В то же время тестологами был взят на вооружение принцип разветвленного программирования, сущность которого состоит в следующем: если испытуемый ответил правильно, то при следующем шаге ему даются более трудные заданиями наоборот. Было замечено, что при таком подходе создаются благоприятные условия для выявления учащимися своих умственных способностей.
В 60-е годы начинаются первые, после долгого перерыва, исследования советских ученых по использованию тестов психолого-педагогической направленности. В основном в этих разработках анализируется многолетний опыт тестирования, накопленный в зарубежных странах.
С начала 80-х гг. начался новый этап в развитии тестирования в России. Для данного периода характерен ряд особенностей. Прежде всего, важным направлением является интенсивное использование компьютеров как в процессе тестирования, так и при обработке полученных результатов. Наряду с этим в ряде западных стран, особенно в США, тестирование становится практически ведущей формой контроля. Такие страны, как Нидерланды, Англия, Япония, Дания, Израиль, Канада, Австралия, развили теорию и практику тестирования, создали службы разработки тестов, занимаются организацией массового тестирования.
В настоящее время в России интенсивно развивается теория и практика педагогических измерений. В обучении иностранным языкам это научные исследования коллектива авторов И. А. Рапопорта, Р. Сельг, И. Соттер, которые обобщили зарубежный и отечественный опыт, разработали методологию научного подхода к тестированию, сконструировали тесты и экспериментально их проверили.
С введением образовательных стандартов, в том числе и по иностранным языкам, появилась необходимость упорядочить и объективизировать средства контроля и оценивания для проверки выполнения требований стандартов к уровню подготовки учащихся. С этой целью проводится эксперимент по массовому тестированию по единым контрольным измерительным материалам (Единый государственный экзамен). Это тесты трех уровней сложности (базовый, повышенный и высокий), которые соотносятся с уровнями владенйя иностранным языком, определенными в документах Совета Европы, следующим образом: базовый уровень— А2+, повышенный уровень— В1, высокий уровень— В2. Для решения научных проблем теории и практики тестирования создан Федеральный институт педагогических измерений.
Применение тестов в мировой практике началось в 80-х гг. 19 в. Это период зарождения и становления тестирования. Теоретические основы тестирования были заложены английским психологом и естествоиспытателем Ф. Гальтоном.Важным вкладом Ф. ■ Гальтона в развитие теории тестов было определение трех основных принципов, которые используются и по сей день:
1) применение серии одинаковых испытаний к большому количеству испытуемых;
2) статистическая обработка результатов;
3) выделение эталонов оценки.
Огромный вклад в развитие тестологии внес французский психолог Альфред Бине. Его можно считать родоначальником современных тестов, предназначенных для диагностики уровня развития интеллекта. Достаточно длительное время тесты развивались как инструмент индивидуальных измерений. Массовый характер тестирования вызвал необходимость перейти от индивидуальных тестов к групповым. В 1917—1919 гг. в США появились первые групповые тесты. Наибольшее применение нашли тесты Артура Синтона Отиса. Основные принципы, использованные при составлении этих тестов, были систематизированы и впоследствии легли в основу всей методологии групповых тестов.
История развития тестирования за рубежом и в России показала, что тесты уровня обученности являются важным способом оценки педагогической деятельности, с помощью которого результаты учебного процесса могут быть достаточно объективно, надежно измерены, обработаны, интерпретированы и использованы в педагогической практике.
Таким образом, стратегия качественной оценки педагогической деятельности, с помощью которого результаты учебного процесса могут быть объективно измерены и использованы в практике обучения, подтверждает их достоверность И'обобщаемость как метод изучения английского языка в вузах Ирана позволяет определить ряд противоречий:
- социально-педагогического характера: между возросшей потребностью образовательных учреждений в высококвалифицированных специалистах иностранного языка, способных эффективно использовать коммуникативные возможности ; и технологии, и действительным уровнем языковой и коммуникативной компетенции у студентов, изучающих английский язык;
б
- научно-теоретического характера-, между необходимостью широкого применения достоверности и обобщаемости тестов ШЬТЭ в процессе подготовки студентов к изучению английского языка на высоком продуктивном лингво-коммуникативном уровне в вузах Ирана и недостаточной разработанностью теоретических основ данного тестового метода;
- научно-педагогического и психологического характера: между целесообразностью использования потенциала достоверности и обобщаемости Международной системы тестирования английского языка (ГЕЬТБ) для эффективной подготовки и участия в лингво-коммуникативном процессе студентов вузов Ирана и отсутствием научно-методического, психолого-педагогического обеспечения, позволяющего достичь конечного результата в этом направлении.
С учетом названных противоречий нами была сформулирована проблема исследования, которая заключается в необходимости научного обоснования и практической разработки путей, обеспечивающих эффективное использование Международной системы тестирования английского языка (ШЬТЭ) в целях формирования лингво-коммуникативнон компетенции студентов при изучении английского языка в образовательном процессе в высшей школе Ирана.
Актуальность проблемы, а также ее недостаточная теоретическая и практическая разработанность в педагогической науке обусловили выбор темы исследования: «Методика изучения достоверности и обобщаемости тестов по ГЕЬТв как форма оценки знаний в образовательной системе Ирана».
Цель исследования :
Диссертация является первой попыткой исследования тестов ГЕЬТЭ как метод изучения английского языка в вузах Ирана. Вообще, качественному тесту свойственно несколько особенностей: действительность, надежность, практичность и эффективность. Благодаря важности создания подходящей обобщаемости и предположений о результативности тестируемых в их академическом "ГШ уровне, основанной на их баллах, управлявших баллами ШЬТБ, обобщаемость будет рассматриваться как одна из необходимых свойств теста по ШЬТв. Поэтому первой целью данного исследования является ответ на вопросы: «до какой степени пользователи тестом могут обобщать решения, принявшие о способности тестируемых к использованию языка для их академических целей на основе их результативности в тесте ШЬТБ»?; «в какой степени тесты ШЬТв, применяемые в Иране, имеют характер обобщаемости»?
Вторая цель данного исследования заключается в анализе достоверности тестов 1ЕЬТ8. Поэтому, второй вопрос, поставленный-при изучении данного вопроса, может звучать следующим образом: «В какой степени система тестирования ШЬТБ практикуется при поступлении в национальные и международные университеты как достоверный образец задач иностранного языка»? Другими словами, необходимо определить, отражают ли материалы тестов ШЬТБ ситуации из реальной коммуникативной деятельности. Следующей целью данного исследования является изучение связи между достоверностью языковых тестов и степенью их обобщаемости.
Объект исследования - подготовка студентов вузов Ирана к Международной системе тестирования английского языка (ШЬТв).
Предмет исследования — процесс вхождения и адаптации студентов вузов Ирана к Международной системе тестирования английского языка (ШЬТБ).
Гипотеза исследования
Процесс достоверности и обобщаемости тестов 1ЕЬТ8, как Международная система тестирования по английскому языку, будет успешным, если:
7
\
- современные академические тесты IELTS будут эффективно использованы в контексте их достоверности и обобщаемое™ для поступления в национальные и международные университеты;
- современные академические тесты IELTS, используемые иранскими абитуриентами для поступления в национальные и международные университеты, обладают значительной степенью обобщаемое™;
- будет обеспечена логическая взаимосвязь между достоверностью и степенью обобщаемое™ академических тестов IELTS.
В соответствии с целью и гипотезой исследования определены следующие задачи исследования:
1) изучить современное состояние проблемы Международной системы тестирования английского языка (IELTS) с учетом ее достоверности и степени обобщаемости в психолого-педагогической и специальной литературе;
2) раскрыть содержание понятая «педагогическое тестирование», «достоверность», «обобщаемость», определить IELTS как метод подготовки к тестированию и изучению английского языка в лингво-коммуннкативном аспекте;
3) разработать, теоретически обосновать эффективность Международной системы тестирования английского языка (IELTS) как структурно-функциональную модель использования английского языка в реальной речевой деятельности;
4) выявить и теоретически обосновать педагогические условия эффективной реализации Международной системы тестирования английского языка (IELTS) как успешного способа подготовки иранских студентов для продолжения учебы в вузах Ирана;
5) проверить экспериментальным путем эффективность Международной системы тестирования английского языка (IELTS) в современном образовательном пространстве Ирана как рациональный способ изучения английского языка абитуриентами для продолжения учебы в вузах мира.
Методологическую основу исследования составили: на общефилософском уровне: целостный подход к личности как многофункциональной сйстеме (Б.Г. Ананьев, П. П. Блонский, Б.С. Блум, Дж. Брунер,
A.П. Брушлинский, Л.С. Выготский, И.А. Турина, А.Н. Леонтьев, Б.Ф. Ломов, RA. Малашихина, СЛ. Рубинштейн и др.); принципы объективности, детерминизма, развития;
- на общенаучном уровне: подходы: системный (Ю.К. Бабанский. В.П. Беспалько, И.В. Блауберг, Э.В. Ильенков, B.C. Ильин, В.В. Краевский, П.Кузьмин, Э.Г. Юдин и др.), структурный (Б.Г. Ананьев, В.И. Загвязинский,
B.В. Кузьмина и др.): концепции контроляв образовательном процессе (В.Г. Айнштейн, 11.Ф. Анисимов, М.Н. Аплетаев, Н.В. Басов, В Л. Беспалько, М.Брызгалова, Ю.Е. Булыгин, Б.С. Гершукский, И.Г. Г'ольцова, В.И. Загвязинский, Г.И. Ибрагимов, А.Я, Наин, В.П. Панасюк, И.П. Подласый, А.Г. Соколов, Т.Н. Шамова и др.);
А. на научно-педагогическом уровне: теория тестологии и педагогической квалиметрии (Л.Н. Лиасгази, Н.Ф. Ефремова, В.И. Звонников, К. Ингекамп, В.М.Кадпевс1сий, В.И. Огорелков, Г.С. Ковалева^ А.Н. Майорова, К.1 Г Персво- щикова и др.); концепции педагогического проектирования и моделирования (B.C. Андреев, В.П. Беспаль ко, И.В. Бестужев-Лада, И.В. Блауберг, Б.С. Гер шунскии, В.В. Давыдов, А .С. Запссоцютй, ГЛ. Ибрагимов, М.С. Каган, А. Кирсанов, В.В. Краевский, М.М. Поташник, В.И. Солдаткин, В.В. Шапкин, Э.Г. Юдин и др.), информатизации образовательного процесса
(И.М. Андреева, С.Г. Антонова, М.Г. Вохрышева, Н. И Гендина, С.Г.Григорьев, АЛ. Ду- латова, А.Г1. Ершов, Н.Б. Зиновьева, Ю.С. Зубов, A.A. Кузнецов, B.C. Ледисв, Н.В. Лопатина, Е.А. Медведева, И.В. Роберт, Т.П. Сарана, ЛЛ. Тихонова и др.).
Теоретическую основу исследования составляют:
- деятельностный подход к обучению (А. Л. Леонтьев, С.Л. Рубинштейн, В.Д. Шадриков и др.);
концепции педагогического тестирования (B.C. Аванесов, В.И. Васильев, ИЛ, Лернер, АЛ, Майоров, ПЛ. Нохрина, М.Б. Мельникова; А.
Шухардииа и др.), качества образования (B.C. Аванссов, В.П. Беспалько, В.А. Кальней, В.А. Караковский, B.C. Лазарев, A.M. Моисеев,"М.М. Поташник, В.М. Соколов, А.И. Субстто, Е.А. Ямбург и др.), развития информационной культуры (Г.Г. Воробьев, Б.С. Гершуиский, А.П. Ершов, И.О. Ладенко, В.М. Монахов и др.);
- идеи оценивания уровня обученности (Ю.К. Бабанский, В.] I. Беспал ько, И.Л. Бим, Л.Г. Денисова, H.H. Крылова, H.A. Курдюкова, Р.К. Миттьяр-Белоручев, Н.В. Мусницкая, Ь.И. Пассов, О.Г. Поляков, Ф.М. Рабинович, Е.Рафф, Н.Ф. Талызина, И.А. Цатурова, С.К. Фоломкина, И.С. Фишмаи и др.);
- исследования диагностики эффективности функционирования педагогических систем (Н.Ф. Ефремова, В.И. Звонников В.И. Огорелков, Г.С. Ковалева и др.).
Методы исследования: теоретические (анализ, синтез, абстрагирование, обобщение), эмпирические (эксперимент, наблюдение, беседа с родителями и учителями), прогностические (проектирование, моделирование), экспериментальные (поисковый/констатирующий, формирующий, контрольный эксперимент), праксиметрические (анализ проектов деятельности, учебной и у чебно-м етодической документации).
В связи с тем, что в данном исследовании были использованы анкеты для сбора сведений, работа считается описательной, и содержание данного исследования показывает появление новых знаний в сфере изучения английского языка, особенно подготовки к сдаче тестов IELTS. Поэтому тестирование может быть частью исследования.
В описательном исследовании рассматривается сбор сведений, тестируются гипотезы либо подбираются ответы на вопросы с учетом настоящего состояния предмета исследования. Другой аспект описательного метода заключается в том, что сбор данных осуществляется либо при помощи ситуативных вопросов (через анкету или собеседование), либо посредством наблюдения.
Избранная методологическая основа и поставленные задачи определили ход теоретико-экспериментального исследования, которое проводилось в три этапа в период с 2007 по 2013 годы. На каждом этапе, в зависимости от задач, применялись различные методы исследования. •
Первый этап исследования (2007-2008 гг.) Ьключал в себя определение проблемы исследования. Проблемы заключаются в определении достоверности и обобщаемости тестов 1ELTS, которые считаются важными качествами такого рода теста.
Второй этап (2009-2010) представлял собой выявления методологии исследования. В данном исследовании используется, в основном, описательный метод.
Третий этап исследования (2011-2013) состоял в сборе данных, который проводилось при помощи анкетирования. Анкеты заполнялись кандидатами,
сдавшими тесты IELTS. Данная анкета определяла достоверность знаний, умений и навыков абитуриентов, вопросы были составлены на английском языке. Эти анкеты были использованы 50-ю преподавателями английского языка в Иране, которые ответили на предложенные вопросы. Анкеты определяли самооценку тестируемых, они были предложены кандидатам, сдавшим тесты IELTS.
Данные, собранные при помощи анкеты, использовались для определения обобщаемости тестов IELTS. В общем, данные собирались при помощи двух анкет. Анкета для определения достоверность тестов, заполнялся лицами, принявшими участие в тестах IELTS, а также учителями IELTS. Данные, собранные при помощи этих анкет, были использованы при определении достоверности 4-х основных коммуникативных навыков: аудирования, говорения, чтения и письмо. Вторая анкета была на персидском языке, заполнялась лицами, сдавшими тест IELTS. Собранная информация была использована при определение степени обобщаемое™ тестов IELTS.
Последний этап исследования состоял также из обобщения результатов тестирования. Собранные данные были проанализированы программой SPSS 18 и в конце на основе анализа данных с использованием SPSS были подведены итоги. Таким образом, исследование представляло собой качественное и описательное изложение, и вся необходимая информация была собрана при помощи предложенных анкет.
Научная новизна исследования состоит в том, что:
- определены педагогические и методические предпосылки применения Международной системы тестирования (IELTS) при изучении английского языка в Иране;
- изучены качества данных тестов Международной системы тестирования английского языка (IELTS), основывающихся на достоверности и обобщаемое™ тестов IELTS, влияющих на оценку знаний тестируемых по данному предмету;
- определены возможности и способности абитуриентов Ирана для дальнейшего обучения в университетах англоязычных стран при помощи тестов IELTS;
доказана важность принятия решений будущими студентами с учетом степени их подготовленности по Международной системе тестирования по английскому языку (IELTS);
доказана ответственность составителей тестов о внедрении и эффективности Международной системы тестирования по английскому языку (1ELTS) в-образовательной площадке Ирана.
Теоретическое значение исследования заключается в следующем:
- разработаны стандартные основы применения Международной системы тестирования по английскому языку (IELTS) в образовательном пространстве Ирана; ,. ■ .
- определены языковые способности кандидатов из числа выпускников школ и студентов Ирана для поступления и продолжения учебы в разные вузы англоязычных стран;
- , доказано, что тест являться единицей измерения знаний и умений кандидатов по английскому языку в контексте применения требований и правил Международной системы тестирования по английскому языку (IELTS);
- установлено, что целенаправленное расширение тестов IELTS занимает особое место для определения уровня языковой подготовленности студентов,
ю
так как тестирование позволяет определить уровень языковых способностей кандидатов различных специальностей;
- доказано, что значимость тестирования зависит от степени значимости и соответствия комментирования, полученного на основе тестовых оценок;
- представлены показатели, определяющие языковые умения тестируемых, умение логично и адекватно обосновать комментирование баллов теста;
- доказано, что действительность структуры и обобщаемость тестов взаимосвязаны, так как если тест не будет действительным, то невозможно правильно определить баллы тестируемого индивида.
Практическое значение исследования
Исследование позволяет определить, может ли тестовая система ШЬТЭ, используемая в Иране, реально оценить языковые способности кандидатов. И в случае их несоответствия необходимо их усовершенствование. Для правильной оценки языковых умений кандидатов предложены пути решения данной проблемы.
Прикладная ценность тестовой системы 1ЕЬТ5 доказана необходимыми его качествами, положительного ответа на вопрос: возможно ли их использование в образовательной системе. В работе доказано, что тестовая система 1ЕЬТ8 обладает ими, автором предложены пути практического решения поставленных в исследовании вопросов.
Международная система тестирования по английскому языку (1ЕЬТ8) оказывает позитивное влияние на дальнейшую активную учебу студентов, на реформирование системы образования, в контексте положительных изменений в сфере международного образования. Предложенная автором система окажет содействие в снижении напряжения тестирования, локализует его отрицательные стороны, повышает положительные его итоги для желающих продолжить учебу.
Результаты исследования могут быть использованы преподавателями ШЬТБ и способствовать применению инновационных методов обучения 1ЕЬТ8 в университетах и различных учреждениях, помогут преподавателям определить, развитию каких способностей учащихся необходимо уделять больше внимания. Поэтому преподаватели могут предложить внесение возможных изменений и дополнений в учебные программы ШЬТв.
Результаты исследования могут быть, использованы магистрами и аспирантами с целью правильного использования стратегии изучения четырех речеязыковых умений, используемых в различных ситуациях использования английского языка.
Обоснованность и достоверность выводов обеспечивается глубоким теоретическим анализом проблемы, опорой на теоретические положения философии, психологии, педагогики и методики преподавания иностранного языка по исследуемой проблеме, разносторонностью методов исследования, их адекватностью целям и задачам исследования; корректным использованием данных психолого-педагогического исследования по проблеме диссертации, методической обоснованностью и адекватностью методов задачам и логике исследования; соблюдением требований к проведению эксперимента; достаточной длительностью и возможностью повторения педагогического эксперимента, позволивших провести количественный и качественный анализ его результатов; репрезентативностью объема выборки и статистической значимостью полученных результатов.
На защиту выносятся следующие положения:
1. Предпосылками исследования Международной системы тестирования по английскому языку (ШЬТБ) выступают: массовая практика применения
подобной системы тестирования в передовых странах мира, в том числе, Ирана, применение тестирования как способа активизации уровня лингвистической и коммуникативной компетентности выпускников школ и студентов, что определяет значимость исследования их тестовой подготовки.
2. Тесты геЫЭ являются методом педагогической диагностики, с помощью которого планируемые и определяемые учебным планом результаты могут быть объективно измерены, обработаны и подготовлены к использованию в педагогической практике.
3. Тест ГЕЬТБ является одним из эффективных инструментов диагностики достижений студентов и абитуриентов, способствующих повышению уровня их готовности для учебы в англоязычных странах, а также в престижных вузах Ирана.
4. Тестовая грамотность и, соответственно готовность к тестовому контролю выпускников школ и студентов, обеспечивается тестовой подготовкой обучаемых, компонентами которой являются:
- выработка мотивации тестирования у обучаемых;
- создание системы тестов школьной и вузовской успеваемости;
- разработка специальных тестов по всем предметам для каждой категории обучаемых.
Апробация и внедрение результатов исследования в практику осуществлялись посредством:
- публикаций результатов исследования в научных журналах, научных вестниках, сборниках, в том числе в Перечне изданий, рекомендованных ВАК РФ;
- педагогической деятельности автора в качестве преподавателя в университете Ирана;
- выступлений автора исследования с сообщениями на различных научно-практических конференциях, посвященных проблемам тестирования, в том числе, использования Международной системы тестирования по английскому языку (ШЬТБ) (Тегеран, Душанбе) в период 2009-2013 гг.
Результаты исследования используются преподавателями 1ЕЬТ8 и способствует применению инновационных методов обучения ШЬТБ В университетах и различных учреждениях Исламской Республики Иран.
По проблеме исследования автором опубликовано 5 работ, в том числе 3 из них в Перечне изданий, рекомендованных ВАК РФ.
Структура диссертации. Диссертация состоит из введения, двух глав, заключения, содержащего выводы, списка использованной литературы. Работа иллюстрирована многочисленными рисунками и таблицами.
ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении обоснована актуальность проблемы, определены объект и предмет исследования; ¿формулирована гипотеза, цель и задачи исследования, выделена теоретико-методологическая основа исследования, дана характеристика основных этапов работы, раскрыта научная новизна, теоретическая и практическая значимость диссертационного исследования, разработаны положения, выносимые на защиту.
Первая глава диссертации - «Исследование достоверности тестов по ШЬТв» - состоит из трех параграфов. В первом параграфе- первой главы -«Краткая характеристика тестов по. английскому языку» - дана история возникновения тестирования в мировой практике. Отмечается, что сегодня по всему миру используются различные ¡тесты, особенно в англоязычных странах, ■ ' 12
для проверки способности изучения английского языка не англоязычными студентами. Эти тесты изменялись по истечении времени, приобрели новые и альтернативные виды. Из числа наиболее важнейших тестов можно назвать TOEFL, OPI, LTP, RTP, WPT и IELTS.
Экзамен TOEFL (Test of English as a foreign Language - английский язык как второй язык) проводится в качестве теста по уровню знания английского языка как иностранного языка. Он представляет собой тест, проверяющий способность человека в понимании, и используется в академической и вузовской среде. Данный тест проводится со стороны специалистов в области образования и предназначен для проверки общей способности по изучению английского языка желающих учиться в американских вузах. TOEFL является критерием приема в нефилологические вузы и учебные заведения с английским языком обучения. Баллы TOEFL считаются действительными в течение 2 лет, и через два года официальный сертификат по нему более не будет иметь значения.
Тест OPI проводится в виде беседы, который продолжается примерно от 20 до 30 минут. Такая словесная беседа осуществляется с помощью телефона между претендентом и специалистом теста OPI (Oral Proficiency Interview-способность вести беседу). Этот тест проверяет способность человека вести беседу, и считаясь стандартом он проверяет общую способность претендента беседовать. Этот тест включает определенное количество личных вопросов и первичной целью OPI является получение достаточной информации о претенденте, чтобы определить его способность беседовать. Тест состоит из четырех этапов, все из которых осуществляется посредством телефона: 1) Первая часть состоит от начинания (начала), в которой претенденту задаются вопросы. 2) Определение степени знаний претендента. 3) Большие поиски информации о владении английского языка претендентом. 4). Продолжение беседы до того времени, пока претендент сумеет ответить на вопросы.
Тест LTP является стандартом и проводится с помощью компьютера, оценивает способность слушания претендентов. LTP (Listening Test for Profissionals - Тест слушания для профессионалов) определяет до какой степени неанглоязычный претендент может хорошо понимать слова и разговоры англоязычных лиц. Претенденты прослушивают тексты и после слушания текстов отвечают на вопросы с четырьмя вариантами ответов. На основе этого теста претенденты делятся на групп и наивысший балл присваивается высшей группе, наименьший - слабой. Этот тест особенным образом используется в США для проверки способности слушания английской речи неанглоязычных для поступления в университеты.
Тест RTP также является стандартным и осуществляется с помощью компьютера и проверяет владение чтением претендентов в определенном языке наподобие английского языка. RTP (Reading Test for professionals - тест чтения для профессионалов) проверяет чтение текста претендентами. Тест включает несколько вариантов вопроса, после чтения которых претенденты должны отвечать на вопросы с четырьмя вариантами ответа. Тестируемые лица на основе своих способностей делятся на 10 групп, представляющих собой от начинающих до высших. Каждый текот в этом тесте имеет 4 вопроса, которые выбраны из формальных и неформальных, социальных, вузовских, дисциплинарных и новостных текстов.
Тест WPT (Writing proficiency test-тест письма) является стандартным тестом, с помощью которого проверяется способность письма претендента в
13
определенном языке наподобие английского. Способность письма претендентов проверяется критериями, определенными заранее. Эти лица должны проверять свое писание в формальном и неформальном виде, т.е. в своем письме использовали как формальный, так и неформальный язык. На основе этого'теста определяется, что в какой степени эффективно и правильно претендент использует письмо в реальных жизненных условиях. Время ответа на вопросы этого теста составляет от 40 до 50 минут. Все эти вопросы предложены в виде незаконченных предложений и претенден5т должен заполнить их.
В общем, тесты OPI, LTP, RTP и WPT являются стандартными тестами, используемые для беседы, слушания, пи, чтения и писания претендентов. Эти тесты являются отдельными, т.е. каждый тест может изучить или проверять лишь одну способность претендента. Эти тесты большей частью используются в США и в результате каждый, кто хочет проверить свои 4 навыки — чтение, письмо, слушание и беседу, должен пройти все 4 теста.
С появлением теста IELTS (Международная система тестирования английского языка) все 4 навыков стали проверяться в рамках одного теста. Следовательно, преимущество теста IELTS по отношению к другим тестам заключается в том, что IELTS проверяет все 4 навыков вместе и имеет два вида - академический и общий.
Во втором параграфе первой главы - «Порядок исследования» -подробно рассматривается порядок проведения настоящего исследования. В качестве первого шага, участникам были переданы необходимые опросные листы непосредственно самим исследователем или через коллег. Также некоторое количество листов было направлено им по электронной почте. После того, как были собраны опросные листы с контрольными вопросами по достоверности, исследователь выполнил их анализ и рассчитал баллы каждого участника по каждому инструменту оценки. Каждому опросному листу был присвоен числовой код, чтобы знать соответствующее число баллов по каждому измерению. После определения баллов из измерений, они вносились в форму для записи данных программного обеспечения SPSS. Данные при интервьюировании немедленно записывались дословно и анализировались с помощью качественного контент-анализа. В этом интервью исследователь концентрировал внимание на взаимосвязях между четырьмя навыками владения, количестве заданий, выступлении с лекцией на международных конференциях на английском языке, составлении отчета о проекте участниками теста IELTS на английском языке, конспектировании во время лекции на английском языке и понимании новостей на английском языке, передаваемых по радио и телевидению. Действия записывались аппаратурой и стенографировались, после чего исследователь выполнял контент-анализ.
В третьем параграфе первой главы проводится «Анализ данных». Результаты достоверности, включая количественную и качественную оценку, представлены в различных частях. Первыми представлены количественные результаты. В следующей таблице представлены описательные данные, включающие средний балл преподавателей и среднеквадратичное отклонение по списку с контрольными вопросами по достоверности.
Описательные статистические данные, включающие средний балл, среднеквадратичное отклонение (SD) и среднюю среднеквадратичную ошибку (SEM) всех пунктов, представлены в таблице 1.
Нет N Меап •' 81(1. Оеу1а1юп 81с1. Еггог Меап
41 100 2.0000 .55048 .05505
Ч2 100 2.9400' .73608 .07361
. чз 100 2.8900 .88643 .08864
Ч4 100 2.6900 .90671 .09067
45 100 2.7600 1.07422 .10742
Чб 100 2.6900 .83720 .08372
Ч? 100 3.0000 .85280 .08528
Ч8 100 2.7900 .91337 .09134'
Ф 100 2.7800 .73278 .07328
я10 100 2.70 .835 .083
ч" 100 2.81 .873 .087
Ч12 100 3.06 .818 .082
413 100 2.8182 .80005 .08041
Я14 100 2.9091 .96986 .09747
415 100 2.7576 .78365 .07876
Я16 100 2.9394 .95638 .09612 ,.
Результаты в приведенной выше таблице показывают, что средний балл у преподавателей в пунктах 1,4,5,6,9,10,11,15 составляет меньше предельного значения, которое равно 3. Поэтому, можно с уверенностью утверждать, что тесты 1ЕЬТ8 академического уровня не являются достоверными в значениях следующих пунктов опросного листа с контрольными вопросами по достоверности:
- имеется соответствие между основными целями заданий на тесте 1ЕЬТ8 и ситуационными заданиями использования иностранного языка (ТЬи).
- выбор контекста теста ШЬТБ яЬляется характерным для выбора контекста ситуационных заданий ТЬи.
- тон заданий теста 1ЕЬТ8 является характерным для ситуационных заданий ТЬи.
- формат заданий теста 1ЕЬТ8 является характерным для ситуационных - заданий ТЬи.
- канал заданий теста [ЕЕТв является тем же, что и канал ситуационных заданий ТШ.
- формат заданий теста 1ЕЬТ8 является тем же, что и формат ситуационных заданий ТИ_1.
- форма заданий теста 1ЕЦГ8 является той же, что и форма ситуационных заданий ТЬи.
- область взаимодействия между исходными данными и ответом на ситуационные задания Т1>и является такая же, что и область взаимодействия у заданий теста ШЬТБ.
- способ беседы в упражнениях теста ШЬТБ в части собеседования является аналогичной беседе в английском языке в реальной жизни.
- формы вопросов 1ЕЬТ8 и английского языка в реальной жизни в различных ситуациях являются аналогичными.
Важными аспектами при обучении и тестировании считаются достоверность и обобщаемость. Существует мнение, что при оценке языковых способностей необходимо учитывать «реальное использование языка». В
15
настоящее время языковые тесты не отражают ситуации из реальной жизни. Бакман и Палмер [1996:148] определили достоверность как степень соответствия характеристик задачи данных тестов особенностям задачи TLU. Существует значительная литература в сфере достоверности и обобщаемое™ тестовой системы IELTS, которая заслуживает глубокого анализа.
Несмотря на важность таких аспектов, как достоверность и обобщаемость тестов IELTS, по данной теме проведено лишь несколько исследований. В 1980 году была создана отдельная секция (ESP) по обучению английскому языку (далее ELT).
ESP вообще ориентировано на исследование и обучение языку в зависимости от необходимостей обучающихся, зависимо от вида работы, академического или профессионального контекста. Таким образом, язык контекста используется для ограниченного предела общительных людей. К примеру, в университете разговорный диалект (стиль, устная речь) используется студентами в различных ситуациях; на семинарах, презентациях и т.п. Курсы ESP прекрасно сосредоточиваются на специфических языковых необходимостях однородных групп обучающихся относительно одного конкретного контекста. Например, курсы ESP могут включать в себя группу языковой чёткости, которая намеривается учиться в университете, работать в качестве инженеров и медсестер в будущем [Бастуркмен & Елдер, 2004:189].
ESP сосредоточивается больше на изучение грамматики и структуры языка, чем на языке в контексте. Это является необходимостью анализа, которая демонстрирует, какие языковые умения больше являются необходимыми студентам, и учебный план, следовательно, приводится в соответствие. Данный курс просматривает изучения на IELTS и содержит развитие, достоверность и обобщаемость IELTS.
Идея достоверности стала фундаментальной на обучение языку и образование учителя языка для почти 40 лет [Гуариенто & Морели, 2001:341]. Это имело большое значение для педагогической практики в обучении английскому языку (ELT) и обучении современным и иностранным языкам. Концепция получила специфическую известность в сфере прикладной лингвистики, вероятно дисциплинарной родины ELT. В общем использовании, термин "достоверность" употребляется с двумя смыслами: одно имеет значение "соответствие", и другой имеет значение "происхождение" (Купер, 1983). Для церковных историков, текст является достоверным, когда соответствует с событиями, которые он описывает.
Купер предлагает, что точные отрасли философии оставались очень долго в одном или другом смысле термина. Правильное мнение достоверности в связи с жизнями, верами или ценностями должно иметь место для обеих идей, предложенных на ежедневное использование. Кроме того, существуют неадекватные философские идеи, которые наверное, обобщаются односторонней связью с одной или другой из данных идей. (с. 8) В прикладной лингвистике идея появилась в конце 1970-ого тогда, когда коммуникационная методология добивалась значения и существовал возрастающий интерес к обучению и тестированию языка реальной жизни (Лекоиз, 2000).
Достоверностью считается как важное свойство теста, потому что это связывает задачу теста с областью обобщаемости, с которой мы хотим обобщать трактовки нашего балла. Достоверность, таким образом, обеспечивает значения для исследования предела, по которому трактовки балла обобщают помимо результативности на тесте для языкового использования в сфере TLU, или для других сфер похожего использования языка без теста. Это связывает
достоверность с действительностью структуры с тех пор как, исследование обобщаемое™ трактовок балла является важной частью действительности структуры [Бачман & Палмер, 1996:117].
Вопрос достоверности всегда был важной частью каждой дискуссии о тестировании языка. Существует мне, согласно которому только реальное употребление языка должно приниматься во внимание, когда оценивают языковую способность. Достоверность, в ранних общительных текстах, означала использование материала в напоминаниях, которые не были написаны для иностранцев, говорящих по-английски, и тест не мог быть общительным если это не был достоверным [Фулчер, 2000:194]. Андерсон [1981:48] называет достоверность "неэффективным аргументом" (с. 48). Современные результативные тесты, которые стремятся отражать некоторую ситуацию критерия во внешнем мире, являются не больше, чем читать по роли или симуляциям, в которых обучающихся спрашивают "представить себе", что они фактически берут подробные изложения (истории) пациента в больнице или дают студентам маленькую лекцию, или занимаются переговорами по бизнесу.
Тесты по языку их самыми сущностями не являются отражениями реальной жизни, но инструменты конструировались на основе теории сущности языка, языкового использования, и обучения языку (Фулчер, 1999; Видовсон, 1978) создавая различие между "подлинностью" и "достоверностью" тестирования языка, обсуждает, что "подлинность является характеристикой отношения между отрывком и читателем и надо делать с соответствующим ответом" (с. 80).
Подлинность рассматривается как свойство всех текстов, пока достоверность в качестве характеристики размещается в тексте данными слушателями. По этому мнению, достоверность была свойством текста, если слушатель мог понять у автора цели, которые могут только быть возможными где слушатель знал правила, использованные писателем или говорящим [Видовсон, 1990, 1998:235]. ' н щ
Джо А. Лекоиз изучил достоверность в тестировании языка в Университете Гонконга в 2000 г. и сосредоточился на некоторых характерных вопросах. Джо сосредоточился на некоторых вопросах, таких как:
1. Какие характеристики являются важными для отличия достоверной формы от задач недостоверного теста?
2. Являются ли некоторые их данных характеристик более важными, чем другие?
3. Какая степень соответствия является нужной для задач теста и задач ТШ для того, чтобы быть общепринятой как достоверной?
4. Могут ли важные характеристики распознаваться для всех тестов, т е общие цели так же как специфическая цель задач теста? '
5. Восприятие достоверности влияет ли на результативность задачи теста и в таком случае, до какой степени? '
Выводы изучения показывают, что восприятия тестируемых о достоверности отличаются, и для некоторых индивидуумов, достоверность является важным аспектом теста. Некоторые факторы кроме соответствия между тестом и задачами ТШ должны влиять на восприятия студентов о задачах теста, и достоверность материалов составляет одну из серьёзных условии для достоверности на занятиях. Данное изучение также показывает отношение между восприятием и результативностью. Предел условий взаимодеиствия с задачами теста будет влиять на восприятие тестируемых, и помогать определить, рассматриваются ли задачи теста достоверно
Тим Морор и Джейн Мортон провели исследование в Австралии. Они сделали сопоставительное изучение и исследовали достоверность задачи академического модуля IELTS по письму в 2 пунктах в тесте по IELTS и университетских аргументах. Они выбрали 155 назначенных задач из курсов бакалавриата и магистратуры и потом в 2 пунктах сопоставили с корпусом из 20 задач IELTS. Они выбрали задачи и задание из ряда студентов в двух университетах в Австралии, т.е. Монаш и университет Мельбурна. Они подвели итоги, что оптимизирующая достоверность IELTS с её увеличивающимся использованием в университете как вступительный инструмент и её соответствующее влияние на программы EAP является особенно настоятельной, и некоторые ограничения должны учитываться, когда мы хотим оптимизировать достоверность задач по письму в тесте по 1ELTS.
Мария Луиса и Ана Алмагро Естебан [2005:167] исследовали достоверность в обучении ESP. Они предложили план и список для оценки достоверности для того, чтобы освободить задачу от отбора и использования достоверных материалов в области ESP. Они пришли к выводу, что хотя достоверные материалы являются очень богатыми источниками для отбора материалов обучения, отбора и использование данного вида материала просит у учителя всестороннюю оценку и достоверность в ситуации обучения-учения должна основаться на соответствии между учением наших студентов и изучаемыми необходимостями.
Робин Спенс-Бровн [2001:149] изучил достоверность в оценке вложенной задачи на уровне курса японского языка в Австралии. Статья рассмотрела активность обучения и оценки, основанная вокруг собеседования носителей языка извне аудитории, которая предназначалась для оптимизирования достоверности. Статья обсуждает, что дополнение степени оценки фундаментально изменяет сущность задачи и затем пойдёт на компромисс достоверности. Это предлагает, что достоверность должна оцениваться на основе внедрения активности, а не её цели, и рассматривает разные факторы, которые влияют на степень достоверности, испытанная индивидуальными студентами.
Махмуд реза Атаи и Масуд Солеймани [2008:195] исследовали влияние достоверности и вида текста на результативность учащихся EFL в тестах С. Участники были 120 старших студентов, специализированных в переводе по английскому языку. Выводы дают понять, что достоверность и вид могут рассматриваться как "специфические аспекты метода теста".
Лекоис Джо. А (2000) также изучил концепцию достоверности и его метод развивался в тестировании языка и общем образовании. Исследователь внимательно изучил важность достоверности для тестируемых и показал, что тестируемые являются готовыми и способными на определение свойств теста, возможно, влияет на их результативность. Бернард Сполски считал, что отсутствие достоверности в материале или методе, использованном в теста, ослабляет обобщаемость результатов и только часть проблемы могут преодолеваться достоверно-видимыми задачами. Наблюдением достоверного действия является другое частичное решение.
Сасан Багерзаде сделал сопоставительное изучение между тестом англоязычных и интервью IELTS С уважением к их достоверности. Он исследовал сущность достоверности в двух интервью: секция интервью TOEFL и модуль IELTS по устной речи. Использовалась структура, характеристик языковой задачи у Бачмана и Палмера (1996) для того, чтобы ответить на вопросы. Результат изучения открывает, что интервью IELTS является более достоверным, чем тестирование англоязычных (TSE) на основе характеристик
теста. Согласно данному изучению, особенности задач теста в интервью ХЕЬТБ являются очень похожими, и отсюда данный экзамен является более достоверным на основе характеристик своих задач.
Кроме того, Пол Хелтай изучил общительные языковые тесты, достоверность и родной язык в Будапеште, Венгрии. Пал Хелтай пришёл к выводу, что все экзаменационные ситуации являются искусственными, и достоверность задачи каждой теста является ограниченной. Не существует задачи теста, которая являйся "достоверной" или "общительной" сама по себе, своей истинной сущностью; "
В отборе задач для" экзаменов, одну надо оценить без предубеждения преимущества и недостатка разнообразных задач теста вместе с внимательным рассмотрением вопроса Практичности. Модули теста связанны с употреблением родного языка (перевод, резюмирование в первом языке, и ответ на вопросы в первом языке ), могут в некоторых случаях быть более практическими, более достоверными и даже более1 общительными, чем в задачах одноязычного теста. Использование родного языка в Тестах по языку не должно быть вопросом теоретической правильности, но вопросом практической методологии.
Лунч [1982:184] утверждает, что хотя разнообразность трактовки достоверности и достоверной оценки появились, одной особенностью достоверности, по которой со временем существовала общая согласованность, является та, что это есть важное свойство для развития теста, который имеет положительный запрос.
На протяжение 1980-х гг. обсуждение достоверности положило большое значение на сущность исходных данных теста с ограниченным вниманием, обратившимся к роли тестируемых в обработке таких как данных. Обсуждение сосредоточено на желательных свойствах тех аспектов тестов по языку, которые составители теста контролируют, сб сторонниками достоверности, распространяя употребление текстов и задач, взявших из ситуации реальной жизни (Каррол, 1980; Дойе, 1991; Морров, 1983), и сторонники скептицизма обратили внимание на ограничения использования как результат и на припятствия, связанные с приравниванием, таким как исходные данные с языковым использованием реальной жизни (Давис, 1988; Сполски, 1995).
В обучении языку, обсуждение сделано, Брином [1985:231], который предложил, что достоверность не может быть единственным понятием, но относится, к текстам (так же как к трактовке тех текстов учащихся), задачам и социальным ситуациям аудитории. Брин обратил внимание на факт, что целью обучения языку является способность на Трактовку значения текстов, и любой текст, двигающийся к достижению той цели играющую роль в обучении. Он предложил, что понятие достоверности было , ясно составным и, это было слишком упрощённым, чтобы делить достоверные и недостоверные материалы на две части, особенно с тех пор, как достоверность была, по его мнению, относительной вместо абсолютного свойстйа". '
Бачман в начале 1990-х гг. полагаясь навдёи, предложенные Видовсоном и Брином, предложил, что' существовала необходимость различить два типа достоверности: ситуационная и' взаимодействующая. Ситуационная достоверность является воспринимаемым совпадением между характеристиками задач теста и задачами TL.II'. Хотя взаимодействующая достоверность является взаимодействием между тестируемым и задачами теста.(Бачман, 1991).
Между прочим, он подтвердил, что достоверность связана с задачами ТЬи больше, чем с совпадением задач теста: он видел достоверность также как свойство, появившееся в вовлечённости тестируемых в задачах теста. Бачман
(1991г.) подтвердил понятие достоверности Видовсона как свойство результата, происходящего из обработки исходных данных, но в то же время свидетельствуя о необходимости объяснить "языковое использование" которое единичное определение подлинности Видовсона вообще не объяснило.
Бачман (1991:111) также признал сложность достоверности, утверждает, что ни ситуационная, ни взаимодействующая достоверность была абсолютной •задача теста ситуационно могла быть очень достоверной, но взаимно низкой достоверностью или наоборот. Данное переосмысление достоверности в составном понятии, относясь к исходным данным теста так же как сущности и качеству исходных данных теста не было похоже на теорию появившейся достоверности в области общего образования. В США, в особенности в конце 1980-начале 1990 гг. рассмотрел движение вдали от стандартизованных многовариантных тестов для большой результативности - основанная оценка характеризовалась оценкой задач, которые были целостными и обеспечили интеллектуальную проблему, были интересными для студентов, и были задачами, по которым студенты могли научиться [Карлсон, 199М481
Следуя Бачману [1991:241], Кохен (1994) определил 3 альтернативных подхода к достоверности в тестировании языка:
1. Обусловливать определением, что тесты по языку прямо являются мерой языковой способности;
2. Рассматривать тесты по языку для оценивания языкового использования
которое похоже на то, что есть в реальной жизни;
_ 3. Рассматривать тесты по языку как достоверно на основе лицевой действительности или лицевой просьбы.
Обсуждение достоверности двигалось в разных направлениях. В обучении языка, Бачман с Палмером в их работе (1996г.) доказали, что понятие достоверности является отличным от инструктивности, определяющей достоверность как "степень соответствия характеристик данных задач теста по языку с особенностями задачи ТШ" (с. 23). Данное определение соответствует с той ситуационной достоверностью, пока инструктивность заменила то, что раньше называлось международной достоверностью.
Предположением в поддержку данного направления было понимание того, что все задачи реальной жизни являются ситуационно достоверными определениями, поэтому достоверность может быть только определением других задач, т.е., те, которые использовались для тестирования или обучения. В то же время, не все настоящие задачи языка являются одинаково интерактивными-некоторые могут ставиться для малых языков. Тем не менее, достоверность является в частичной зависимости от соответствия между взаимодействием появляющимся из теста и задач ТШ; рассматривая эти два как раздельные сущности, следовательно, вводящие в заблуждение. Непременно Даглас [2000:1571 продолжает видеть эти два как аспекты достоверности, доказывая, что им нужно представить в тестах по языку для специфических целей.
Чтобы приблизить степень соответствия менаду тестом и задачами ТШ -т.е., определить достоверность задач теста - Бачман и Палмер [1996:183] предложили структуру характеристик задачи. Данная структура предусматривает систематический метод совпадения задач на основе их задания, категории теста, исходные данные теста и выводы задач ожидаются приводить результаты, и отношения между исходным данным и ответом (для целой структуры, см. Бачман и Палмер, 1996: 49-50).
Структура является важной, так как она предусматривает полезный контрольный вопрос характеристик задачи, один из которых принимает во
внимание степень согласия среди разработчиков теста, заинтересованных в выяснении достоверности задач теста. Это принимает во внимание оба исходных данных, предусмотренных в тесте так же как ожидаемый вывод, возникающих из исходных данных при помощи характеристики не только задач теста, но и также взаимодействий тестируемых с этими.
Рассмотрение литературы показывает, что s обобщаемость - это действительность предположений, которые создаются на основе балла тестируемых в умении теста ESP (обобщение действительности) локальных тестах ESP, уместно не изучены. Тем не менее, другие два более известных теста: TOEFL и IELTS, которые обеспечивают ясность'умения в английском языке для не англоязычных (NESB) студентов, исследовались на основе их обобщаемости. Последние изучения достоверности тестов представляются в следующих параграфах.
В последние 20 лет, изучения, занимающиеся отношением между языковым умением и академическим достижением были проведены. Оллер [1979:161] считал, что язык, родной или иностранный, имел ключевое влияние на процесс обучения в школе. Он предложил, что учителя всех предметов, не только учителя по языку, должны обучать и практиковать учащихся усваивать все 4 умений слуха, чтения, письма и устной речи. Атта Гебрил изучил обобщаемость балла "академических задач по письму и стремился исследовать, как задачи по проверке навыков понимания устной или письменной речи являются:' сравнимыми с самостоятельными задачами на основе обобщаемости балла, i "••""
Чтобы изучить данную проблему, 115 студентов египетского университета спрашивали написать на двух самостоятельных задачах И двух задачах rio проверке навыков понимания устной или письменной речи. Испытания целостно оценивались тремя сквернословами, которые получили подготовку до оценки. Результаты показали, что задачи по проверке навыков понимания устной или письменной речи произвели надёжные баллы как самостоятельные. Кроме того, результаты показали, что обобщаемость ■ балла является очень медленной, когда используется одна задача по письму благодаря большому разногласию компонента. Следствия и ограничения изучения представляются.
Брунер (1975) обсудил' отношение' между- способностью общаться и способностью анализировать. Он утвердил, что студенты, занимающиеся активными разговорами, создадут основу своего знания. Бирейтер и Скардамалия (1982) пришли к выводу^ что проблемы обучения разговору и обучения письму привели к академической неудаче. Камине и Свайн (1986) создали теоретическую структуру, описывая различие между академическим . языком и разговорным языком. Недавно, согласно No Child Left behind Aci of , 2001 США, изучения сделались оценить академическое достижение обучающихся в двуязычном контексте. ' . .
Деми, Таллин, и Балтер рассмотрели отношение между уровнем английской беглости двуязычных студентов и академическим достижением и пришли к выводу, что двуязычные студенты, которые не были беглыми в английском языке, стремились делать не так лучше, как в школе, и те, которые были совершенно беглыми в английском языке, обычно превосходили своих англоязычных ровесников многозначительно. Като, Албус, Лио, Гавен, и Турло (2004) сообщили, что существовало странное отношение между , полный, всесторонним оцениванием и английском тестом академического уровня.
Однако существуют аргументы против отношения между языковым умением и академическим успехом. Барт и Далай показали, что студенты не добивались успехи в школе, потому что тесты по их умениями и знанием не
даны в естественных контекстах. Егли, Мусиал, и Смуловитс (1999) сравнили результативность на двух стандартизованных тестах умения английского языка с тремя мерами успеха: настойчивое удовлетворение; оценка факультета и коллеги; и баллы на объективном тесте медицинского умения. Только настойчивое удовлетворение и оценка факультета и коллеги были связаны с умениями английского языка.
В дополнение к тестам IELTS и TOEFL, подтверждение правильности структуры оценки результативности изучалось. Оценка результативности типично спрашивает студечтов показать процессы их размышления и доказательства для того, чтобы преподаватели смогли сделать прямое заключение о сущности и глубине понимания студентов. Лан, Лиу, Анкенман, и Стон [1996:214] и Мессик [1994:117] далее изучили, что оба логического и опытного доказательства должны быть представлены для того, чтобы взять действительное заключение из оценки результативности. Они характеризовали логические действительность и законность как необходимый критерий для оценивания результативности. Как уже указано Мессиком [1995:235], оценка результативности действительности структуры может определиться отношением между баллами оценивания результативности и другими конечными структурами измерения.
Прошедшее исследование обнаружило основные объединения для оценки результативности с хорошо созданными измерениями. Рассмотрение Программы Оценивания Результативности Университета Мериланда (MSPAP), Йен и Феррара [1997:154] раскрыло, что языки чтения и письма, и оценки математики MSPAP показывают значительное взаимоотношение (а = 0.54 до 0 78) с языком чтения, и оценками математики Всесторонних Тестов Основных Умений Четвёртое Издание (CTBS-4). Хупер (1988) также обнаружил основные взаимоотношения (а = 0.36 до 0.80) между компонентами по чтению Предельного Теста Образцов по Чтению-Орфографии, оценкой результативности, и тестами по чтению из SAT-9 баллов.
Исследуя действительность и обобщаемость оценки результативности математики-QU AS AR=KyACAP Когнитивный Инструмент Оценивания (QCAI) Лан и др., (1996) и Мессик (1994) обнаружили умеренно высокие взаимоотношения (а = 0.48 до 0.72) между баллами QCAI и решением математических проблем и тестами концепций Теста Основных Умении Айова, Ступень-4 (ITBS-4). Они также обнаружили, что Новые Стандарты Исследования Научной Ссылки (для средних школ), это стандарт обоснованного оценивания с главным образом результативностью основанных пунктов, умеренно соотносится с баллами SAT-9 и Тестом Способности Университета Отис-Леннон, 7-ое издание (OLSAT-7), с соотношением коэффициентов .63 и .60 соответственно. Другие подвели итоги, что три оценки классифицировали результативность студента в подобных направлениях.
Оценки результативности могут также иметь довольно странную предсказывающую действительность на будущие достижения. Дейвис и др. (2002) обнаружили, что балловые компоненты оценки критерия письма многозначительно предсказывают достижение в SAT-9 и баллах Выходных Экзаменах Гимназии (HSEE). Функция, основанная на балловых компонентах, правильно идентифицировала 77% студентов выше или ниже 50 % на распределение балла письма SAT-9 и 67% студентов выше или ниже 50 % на распределение балла Письма HSEE.
Вторая глава диссертации - «Исследование обобщаемое™ академических тестов по ШЬТБ и обобщаемость связи с достоверностью по ¡ЕЬТБ» - состой* из двух параграфов.
В первом параграфе рассматривается «Понятие обобщаемости». Обобщаемость ссылается на степень, чьи результаты исследования могут оправданно обращаться к ситуации вне о1фужения исследования. Обобщаемость ссылается на степень, чьи результаты изучения применяются к индивидуумам и обстоятельствам вне тех изучений. Этот уровень, по которому выводы данного изучения могут быть экстраполированы на другое население. Результаты изучения обосновываются обобщённо, если они имеют значимые характеристики и значения для индивидуумов больше тех в продуманном образце.
Обобщаемость является важным критерием в интерпретации результатов изучения решения, будут ли выводы изучения применяться к практике индивидуального курса. Обобщаемость применяется к исследователями в академической установке. Это расширение выводов и заключений исследования из изучения, проводившегося на выборочном населении свободно. Это требует данных о большом населении.
Чем больше выборочное население, тем больше мы можем обобщать результаты. Дело в том, что оценка результативности должна обеспечивать репрезентативную сферу действия содержания и процесса составления сферы построения. Т.е. балл интерпретации не должен ограничиться только образцом оценивших, но обобщён составлением сферы построения .Это кажется, что обобщаемость может покрывать значение надёжности так же как взаимовлияния, которые пользователи тестом Языка для Специфической Цели (ЬБР) могут создать о способности тестируемых в ситуации использования языка.
Во втором параграфе второй главы приводятся «Результаты тестов ШЬТв, проводимых по всему миру». Английский консул сообщает о результатах тестов ШЬТБ, проводимых по всему миру на интернет-сайтах теста 1ЕЬТ8. Последнее ежегодное сообщение по этому тесту было выполнено в 2011 г., хотя до сих пор ежегодное сообщение по 2012 г. все еще не вложено на этот сайт. Такое ежегодное сообщение представляет хорошее сообщение претендентам теста 1Е1Л"8, языковедам, разработчикам тестов и учителям английского языка. Анализ этих данных по четырем навыкам, по которым они сдавали экзамен, осуществляется на основе пола претендентов и вида теста 1ЕЬТ8, т.е его академичности или общности. Ниже приводится сообщение консула Англии кратким образом.
Таблица №2
Год 2011
Академический 78,3%
Общий 21.7%
В таблице №2 данные проанализированы на основе количества участников в двух видах теста 1ЕЬТ8, т.е. академическом и общем. Согласно данных этой таблицы 78,3% претендентов сдали академический тест ШЬТБ, и 21,7% претендентов сдали тест 1ЕЬТ8 по общему виду во всех частях мира.
Чтобы увидеть наличие или отсутствие обобщаемости у теста ШЬТБ, мы попробовали выполнить четыре различных регрессионных анализа для разных навыков владения языком.
Регрессионный анализ слуха
Регрессионный анализ был выполнен для исследования вопроса о том, а можно ли по баллам учащихся на тесте ШЬТЭ предсказать их баллы по навыку
слуха на академическом уровне. В таблице 3 показана статистика вывода регрессионного анализа.
Model В ею. R R-Square Adjusted R square
Listening .076 .11 .006 .003 .003
.11.
па 1л,нивс данной таолицы «к.» равняется .006 и равняется .и.
Следовательно, способности слуха не обладает обобшаемостыо, то есть невозможно на основе оценки по тесту ШЬТБ прогнозировать, что участники теста на основе баллов могут с академической слышать и понимать на хорошем уровне. Таблица №4 Регрессионный анализ устной речи
Model В Sie. R R-Square Adjusted R square
Speaking .076 .1 .10 .10 .10
Как можно заметить, результаты линейного регрессионного анализа показывают, что баллы участников за модуль устная речь теста ШЬТБ не позволяют существенно предсказать баллы учеников за академический навык слуха. Поэтому, не было отмечено никакой существенной корреляции между баллами участников теста за модуль слуха ШЬТв и их баллами за задания на слух в академических ситуациях в реальной жизни (уровень значимости = 1, Я - .10 и скорректированный Я-квадрат = .10). Модуль устная речь теста ШЬТБ позволяет объяснить только 10 % вариаций заданий на устную речь в реальной академической жизни участников теста.
Таблица 5: Регрессионный анализ письма
Model В Sig. R R-Square Adjusted R square
Writing .76 .05 .40 .20 .20
Результаты в приведенной выше таблице показывают, что баллы участников за модуль письма теста ШЬТв могут в значительной мере предсказать их баллы за задания на письмо в ситуации использования языка перевода. Результаты в следующей' таблице также показывают, что скорректированный Я-квадрат равен .20. Таким образом, модуль письма теста ШЬТБ может объяснить только 20% вариаций заданий на письмо в реальной академической жизни участников теста.
Таблица 6: Дисперсионный анализ
Model Sum of Squares Df Mean Square F Sig.
Regression 1.953 1 1.953 1.6 .21
Residual 28.007 23 1.218
Total 29.960 24
■— —— •■г""-«'-"""" 1иилпцо1, 1— 1 .и, и уровень значимости равен .21. Поскольку уровень значимости превышает .05, можно утверждать, что модуль чтения теста ШЬТБ не позволяет в значительной степени предсказать результаты участников теста в заданиях на чтение в ситуациях использования языка перевода. Скорректированный Я-квадрат равен .025, что составляет
только 2.5% баллов за задания на чтение в ситуациях использования языка перевода, которые были предсказаны с помощью модуля чтения теста ШЬТЭ.
В третьем параграфе второй главы рассматривается «Соотношение между обобщаемостыо и достоверностью». Для того, чтобы рассчитать соотношения между обобщаемостью и достоверностью тестов ШЬТБ, мы вычислили баллы учащихся по анкете самооценки и разделили это значение на 4. Затем, мы обозначили его зависимой переменной и обозначили баллы за достоверность независимой переменной. Наконец, был вычислен коэффициент корреляции произведения Пирсона. Результаты показаны в следующей таблице.
Достоверность Обобщаемость
Достовер Pearson Correlation 1 .7
ность Sig. (2-tailed) .01
N 70 70
Обобщаем Pearson Correlation .7 1
ость Sig. (2-tailed) .01
N 75 75
Поскольку уровень значимости = .01 и г = .7, можно утверждать, что присутствует существенная корреляция между баллами участников теста по достоверности и баллами по обобщаемое™ в тестах ¡ЕЬТв.
В данной диссертационной работе было проведено качественное и количественное исследование. Для сбора необходимых сведений было использовано два вида анкет: анкета для самооценки и анкета для определения достоверности. Данные, собранные путем самоконтроля, используются для определения и анализа языковых умений и обобщаемости тестов 1ЕЬТ8. А также были использованы анкетные данные для определения и анализа достоверности тестов ШЬТБ. При помощи этих анкет были собраны данные для анализа работы. Другим источником сбора необходимых данных, используемых для исследования и определения качества достоверности, являются беседы.
Анкета для самооценки выдается 70 кандидатам, сдавшим тесты ШЬТБ (их имена указываются в приложении). Анкета для определения достоверности выдается 100 преподавателям, чьи имена указаны в приложении. Эти преподаватели должны иметь не менее 5 лет опыт работы, а также 70 кандидатам, сдавшим общий модуль тестов [ЕЬТв. Данные анкеты будут рассмотрены ниже.
Анкета для самооценки
Данная анкета состоит из двух частей, в первой части которой рассматривается общая информация об участниках исследования. Сведения о специальности, уровень образования и полученные при тестировании баллы необходимо приводить в первой части. Вторая часть анкеты состоит из 4 подразделов, включающих слух, речь, чтение и письмо, которые в свою очередь состоят из 10 вопросов. Кандидаты проверяют свои языковые способности по пятибалльной системе (от 1 до 5), где знания оцениваются от очень слабого уровня (1 - очень слабый) до очень хорошего (5 = очень хорошо). Таким образом, кандидаты должны ответить на вопросы по четырем видам языковых умении, которые в свою очередь включают в себя по 10 вопросов, что в общей сложности составляет 40 баллов.
Статистический анализ показал, что данная анкета приемлема для определения достоверности тестов IELTS, и их с уверенностью можно ■"."'.. применять при тестировании кандидатов.: .
Анкета для определения достоверности тестов IELTS В целях определения и анализа достоверности тестов IELTS Бакманом и Палмером (2000) была подготовлена анкета, которая впоследствии была переведена на персидский язык. Надёжность перевода была проверена при помощи техники обратного перевода и затем утверждена. Данная анкета состоит из 4-х частей, включающих 16 вопросов, оцениваемых по пятибалльной шкале Likert (от 1до 5). В данной анкете учитывается мнение 100 преподавателей английского языка и 70 кандидатов, сдавших тесты IELTS. Структурная ценность данной анкеты была утверждена после проверки при помощи статистики и программы SPSS 18, и на основе статистических данных было выяснено, что анкета обладает структурной ценностью. После раздачи анкеты кандидатам, им необходимо заполнить английскую часть. Таким образом, при помощи анкеты рассматривается мнение кандидатов, сдающих тесты IELTS и преподавателей английского языка относительно двух аспектов, обобщаемое™ и достоверности тестовой системы IELTS.
В заключении диссертации изложены результаты, полученные по итогам проведенного исследования. Автор отмечает, что иранская система образования нуждается в современных методах тестирования и объективной оценке учебных достижений субъектов образования по английскому языку. Сегодня одним из наиболее эффективных способов изучения английского языка является Международная система тестирования английского языка (IELTS).
Результаты проделанной работы свидетельствуют о том, что выдвинутая в процессе = • экспериментальной работы гипотеза полностью подтвердилась. Разработанная в диссертации модель тестовой подготовки по Международной системе .тестирования английского языка (IELTS) преобразует тестовую подготовку в одну из базовых форм оценки достижений студентов и абитуриентов Ирана/что существенно повышает их тестовую грамотность по английскому Языку.
ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ ОТРАЖЕНО В НИЖЕСЛЕДУЮЩИХ ПУБЛИКАЦИЯХ АВТОРА
Статьи, опубликованные в изданиях из перечня ведущих рецензируемых журналов, рекомендованных ВАК МО РФ:
1.Шакибои Гударз. Влияние неформального языка на английское чтение согласно модуля IELTS // Вестник Таджикского национального университета. №4/6(97), 2012. - С. 103-106.
2. Шакибои Гударз. Взаимоотношения между навыками чтения и письма по IELTS // Вестник педагогического университета. № 5(48), 2012. - С.216-219.
3. Шакибои Гударз. Корреляционный анализ навыков речи и слуха по материалам 2011года из 41 страны по академическому тесту IELTS // Вестник педагогического университета. № 6(43), 2012. -С. 175-179.
Статьи, опубликованные в других научных журналах и изданиях:
4. Goodarz Shakibaei. The effect of concept mapping on English language academic achievement and meaningful learning of high school students: Journal of American Science, No (8). 2012,450-455.
5. Goodarz Shakibaei. New General English through reading book (reading module of IELTS), Rahe Novin Press, 2012.
Сдано в печать 13.01.2014г. Подписано в печать 14.01.2014. Формат 60x84 1/16. Бумага офсетная.
Печать офсетная. Тираж 100 экз. Отпечатано в типографии «Сифат» г.Душанбе, ул.Айни 45