Прирачник за лингвисти · Claude Проекти

Користење на Claude Проекти за лингвистичка анализа на македонски текстови

Детален прирачник за лингвисти. Автор: проф. д-р Гоце Митревски

Дел 01

Што се Claude Проекти и зошто да ги користите?

Основниот проблем кој го решаваат Проектите

Стандардните AI сесии за разговор се „без состојба" (stateless): секој разговор почнува од нула. Ако го анотирате корпус на македонска народна поезија во рамки на повеќе сесии, би морале повторно да ги прикачувате вашите текстови, повторно да го објаснувате вашиот теориски оквир и повторно да ја дефинирате вашата терминологија во секој нов разговор. Claude Проектите го решаваат ова со создавање на постојани работни простори во кои вашите документи, инструкции и историјата на разговорот се зачувуваат во текот на сите сесии.

Клучни карактеристики релевантни за лингвистите

Постојана база на знаење Секој проект ја одржува сопствената библиотека на документи. Еднаш го прикачувате вашиот корпус, граматиките, речниците и теориските рамки, и Claude има пристап до нив во секој следен разговор во рамки на тој проект.
Сопствени инструкции Пишувате збир инструкции кои Claude ги следи автоматски во секој разговор — вашата претпочитана шема за анотација (на пр. Лајпцишки правила за глосирање), теорискиот оквир (на пр. Генеративна граматика, Функционална граматика, Конструкциска граматика), вашите конвенции за транслитерација, форматот на излез и секоја специфична терминологија.
Историја на разговорите Сите разговори во рамките на еден проект се зачувани и видливи, за да можете да ги прегледате претходните анализи, да следите како се развивала вашата методологија и да ја споделите евиденцијата со соработниците.
Континуитет на контекстот (RAG режим) Кога вашата прикачена база на знаење порасне, Claude автоматски го активира Retrieval-Augmented Generation (RAG) за интелигентно враќање на најрелевантните делови од вашите документи за секое прашање.
Споделени тимски проекти При претплатите Team и Enterprise, можете да ги споделувате проектите со колегите, доделувајќи им дозволи само за преглед или за целосно уредување. Ова е идеално за истражувачки тимови кои заеднички работат на македонски корпус.

Достапност

Бесплатна сметка
$0

До 5 проекти; основно прикачување документи.

Pro сметка
$20/мес.

Неограничен број проекти; RAG режим; значително зголемен капацитет за документи.

Team сметка
$25/кор./мес.

Сè од Pro плус соработничко споделување, тимски активности и организациски поставки.

Дел 02

Поставување на вашиот прв лингвистички проект

Постапка чекор по чекор

  1. Одете до Проекти Посетете claude.ai/projects, или лебдете со глувчето над левата страна на вашата Claude сметка и кликнете „Projects."
  2. Создадете нов проект Кликнете „+ New Project" во горниот десен агол.
  3. Именувајте го и опишете го проектот Изберете јасно, специфично име. Имајте предвид дека Claude самиот не го чита името или описот — тие служат исклучиво за вашата сопствена организација. Добри примери:

    Македонски усен корпус — Морфолошка анотација
    Современ македонски печат — Синтаксичка анализа
    МК дијалекти — Теренска работа, Западен регион 2024
  4. Конфигурирајте ја видливоста (Team/Enterprise) Изберете „Private" ако станува збор за индивидуално истражување, или „Share with organization" ако сакате колегите да го пронајдат и користат проектот.
  5. Додадете ја вашата База на знаење На десната страна на главната страница на проектот, кликнете „+" за да додадете содржина. Погледнете го Дел 3 за детални упатства.
  6. Напишете ги вашите Сопствени инструкции Кликнете „Set instructions" (или „Edit instructions") на страницата на проектот. Ова е најважниот чекор за обезбедување аналитичка доследност. Погледнете го Дел 4 за детални примери.
Дел 03

Изградба на базата на знаење

Базата на знаење е темел на вашиот проект. Сè што прикачувате е достапно за Claude во текот на сите разговори во рамките на тој проект, без повторно прикачување.

Поддржани формати на датотеки

PDF, DOCX, TXT, HTML, ODT, RTF, EPUB и CSV. Секоја датотека може да биде до 30 MB. Вкупната база на знаење мора да се вклопи во прозорец на контекст од 200.000 токени (приближно 500 страници текст). Со овозможен RAG (Pro и погоре), оваа граница е значително проширена.

Што да прикачите

Примарен корпус

Прикачете ги вашите македонски текстови во чист текстуален или PDF формат. Именувајте ги датотеките описно:

korpus_narodni_pesni_veleski_region.txt
vesnik_Nova_Makedonija_2022_primer.pdf
intervju_transkripti_bitola_2023.txt

Референтни граматики

  • Граматика на македонскиот литературен јазик на Конески (или релевантни извадоци)
  • Дескриптивната граматика на македонскиот јазик на Фридман
  • Специјализирани монографии за македонска глаголска морфологија, клитики и сл.

Речници и лексички ресурси

  • Вашиот сопствен речник специфичен за проектот (стандардизирана терминологија)
  • Двојазичен македонско-англиски речник ако создавате излез на англиски јазик
  • Списоци на специјализиран речник (дијалектни форми, архаизми, заемки)

Упатства за анотација

Документ со објаснување на вашата шема за анотација. Ако ги следите Лајпцишките правила за глосирање, вметнете ја листата на релевантните скратеници. Ако користите сопствена PoS ознакарска шема, документирајте ја тука.

Документи за теорискиот оквир

Ако вашата анализа се заснова на конкретен теориски оквир, прикачете резиме: „Овој проект ја користи Роловата и референтна граматика. Клучните концепти вклучуваат: [...]." Ова го заземјува металингвистичкиот речник на Claude.

Практични совети

  • Секоја датотека нека биде фокусирана. Не прикачувајте еден огромен документ кога неколку помали би биле поефикасни за пребарување во RAG режим.
  • Текстуалните датотеки се посигурни отколку PDF-датотеки со сложени распореди, особено за кирилски текст. Ако PDF верзијата на вашата граматика има проблеми со кодирањето, претворете ја прво во обичен текст.
  • Ажурирајте ја базата на знаење со развојот на проектот: бришете застарени датотеки и прикачувајте поправени верзии. Нема автоматско верзионирање, па одржувајте свои локални резервни копии.
  • Директно вметнувајте кратки референтни текстови со опцијата „Add text" — тоа е побрзо отколку да создавате датотека за мали исечоци.
Дел 04

Пишување ефективни инструкции за проектот за македонска лингвистика

Полето за сопствени инструкции е најмоќната алатка за прилагодување на однесувањето на Claude. Замислете го тоа како постојано упатство кое Claude го чита пред секој разговор во овој проект. Пишувајте јасно, со прецизност, во заповедна форма.

Структура на добри лингвистички инструкции

  1. Вашата улога и контекст на стручност — му кажува на Claude со кого соработува
  2. Предметот на проучување — јазикот, варијететот, периодот, жанрот
  3. Теорискиот оквир — металингвистичкиот јазик кој Claude треба да го употребува
  4. Шемата за анотација — точно како Claude треба да ги форматира анализите
  5. Барања за форматот на излезот — табели, интерлинеарни глоси, проза и сл.
  6. Јазик на излезот — англиски, македонски или двата
  7. Што да се означи — неизвесни случаи, гранични случаи, празнини

Целосен пример: Проект за морфолошка анотација

Пример за инструкции — Морфологија
Им помагате на професионален лингвист специјализиран за македонска
морфологија. Вашата улога е да вршите точна морфолошка анализа на
македонски текстови.

ЈАЗИК И ВАРИЈЕТЕТ:
Текстовите се на стандарден современ македонски јазик (литературен
стандард кодифициран по 1945 г., врз основа на централните дијалекти).
Означете ги сите форми кои изгледаат нестандардни или дијалектни,
наместо да ги нормализирате без забелешка.

ТЕОРИСКИ ОКВИР:
Користете пристап заснован на морфеми (item-and-arrangement).
Третирајте го македонскиот јазик како аглутинативно-флексивен јазик.
Следете ги Лајпцишките правила за глосирање за сите интерлинеарни глоси.

ШЕМА ЗА АНОТАЦИЈА:
За секоја словна форма, дајте:
  1. Зборот онака како стои во текстот (кирилска правопис)
  2. Лемата (речничка форма)
  3. Зборовна класа
  4. Сегментација морфема по морфема со цртички
  5. Линија со глоса со лајпцишки скратеници
  6. Глоса на превод на англиски за целиот збор

Форматирајте ги сите интерлинеарни глоси во блокови од четири реда:
  Ред 1 (мак):    оригинален македонски текст (збор или синтагма)
  Ред 2 (морф):   сегментација на морфеми
  Ред 3 (глоса):  лајпцишка глоса
  Ред 4 (англ):   слободен превод на англиски

ЗБОР НА ЗБОРОВНИ КЛАСИ:
N (именка), V (глагол), ADJ (придавка), ADV (прилог), PRON (заменка),
DET (определница/член), PREP (предлог), CONJ (сврзник), PART (честичка),
INTERJ (извик), NUM (број).

МОРФОЛОШКИ КАТЕГОРИИ ЗА ГЛАГОЛИ:
Глаголско време (PRES, PAST, FUT, PERF, PLUPERF), Вид (IPFV, PFV),
Начин (IND, IMP, COND), Лице (1, 2, 3), Број (SG, PL), Залог (ACT, PASS),
Евиденцијалност (DIR, INDIR — означете ги конструкциите со л-партицип
со INDIR кога контекстот поддржува пренесено/непосведочено значење).

МОРФОЛОШКИ КАТЕГОРИИ ЗА ИМЕНКИ:
Род (M, F, N), Број (SG, PL), Определеност (INDEF, DEF.PROX, DEF.MED,
DEF.DIST за тројниот систем на членови), Падеж (само за заменки и вокатив).

ОЗНАЧУВАЊЕ — Означете со [ЗАБЕЛЕШКА: причина]:
- Дијалектни форми
- Архаизми или заемки од црковнословенски
- Нејасна сегментација со двосмислени граници на морфеми
- Форми кај кои видот е лексички двосмислен

ЈАЗИК НА ИЗЛЕЗОТ: Англиски, освен ако не барам изречно македонски.

Пример за инструкции: Проект за синтаксичка анализа

Пример за инструкции — Синтакса
Им помагате на лингвист кој работи на македонска синтакса во рамките
на Минималистичката синтакса (Чомски 1995 и понатаму).

ЈАЗИК: Стандарден македонски. Обрнете посебно внимание на клитичката
група (системот на клитики во втора позиција), феномените V2 во
зависните реченици и системот на определен член.

АНАЛИТИЧКА ЗАДАЧА:
Кога ќе ви се даде македонска реченица или пасус, создадете:
  1. Структурен опис на реченичната архитектура на обичен англиски
  2. Дрво на фрасна структура во нотација со означени загради
  3. Идентификација на сите клитики, нивната категорија и нивниот домаќин
  4. Коментар за операции на поместување во површинскиот низ
  5. Забелешки за параметарски поставки (V2, нулта субјект, удвојување)

АНАЛИЗА НА КЛИТИКИ:
Македонскиот има строг редослед: AUX > DAT > ACC (> REFL).
Секогаш утврдете дали клитичката група се придржува или отстапува
од овој канонски редослед и коментирајте ги отстапувањата.

УДВОЈУВАЊЕ НА КЛИТИКИ:
Македонскиот продуктивно ги удвојува полните DP со клитики. Означете ги
сите случаи и наведете дали удвоениот DP е субјект, директен или
индиректен предмет.

ОЗНАЧУВАЊЕ: Означете ги граничните анализи со [АНАЛИТИЧКА ЗАБЕЛЕШКА: ...]

ИЗЛЕЗ: Прозна анализа на англиски следена со нотација со означени загради.
Не создавајте конституентни дрвја во ASCII уметност освен ако не барам.

Совети за пишување инструкции

  • Бидете конкретни за граничните случаи. Ако македонската евиденцијалност или тројната дистинкција за определеност се важни, дефинирајте ги вашите термини.
  • Наведете и тоа што НЕ сакате. На пример: „Не обидувајте се да доделувате падежни ознаки на именките освен заменките, бидејќи македонските номинали се без падеж."
  • Итерирајте. По неколку разговори, вратете се на инструкциите и усовршете ги врз основа на резултатите.
  • Чувајте ги инструкциите под приближно 1.500 зборови за да не го намалите просторот за корпусниот текст.
Дел 05

Аналитички задачи: Промптови и работни текови по области

Откако ќе го поставите проектот со база на знаење и сопствени инструкции, секој разговор во рамките на проектот почнува со тој целосен контекст. Следните делови покажуваат како ефективно да го промптирате Claude за конкретни лингвистички задачи.

5.1 Морфолошка анализа

Основно барање за анотација
Дајте целосна морфолошка анализа на следниот пасус.
Следете го форматот на интерлинеарна глоса дефиниран
во инструкциите за проектот.

[Вметнете македонски текст тука]
Фокусирана анализа на глаголи
Извлечете ги сите глаголски форми од текстот подолу.
За секоја глаголска форма, дајте: површинска форма, лема, вид,
глаголско време, начин, лице, број и забелешка за типот на
конструкцијата (синтетска наспроти аналитичка).
Прикажете ги резултатите во табела.

[Вметнете текст]
Компаративна анализа на флексијата
Следниот текст содржи и свршени и несвршени глаголи со истиот корен.
Идентификувајте ги сите аспектни парови, глосирајте ги секоја форма
и опишете го семантичкото/прагматичкото спротивставување видливо
во контекстот.

[Вметнете текст]
Инвентар на клитики
Наведете ги сите клитики во следниот текст. За секоја, наведете:
клитичката форма, нејзината граматичка категорија (датив/акузатив/помошен
глагол), реченицата на која припаѓа, нејзиниот синтаксички домаќин и
дали е присутно удвојување на клитики.

[Вметнете текст]

5.2 Синтаксичка анализа

Реченична структура
Анализирајте ја синтаксичката структура на следните македонски реченици.
За секоја реченица, дајте претстава во означени загради и прозен опис
на архитектурата на главната реченица, типот на субординација
(ако постои) и секои операции на поместување кои ги идентификувате.

[Вметнете реченици]
Редослед на зборови и информациска структура
Следните реченици се топикализирани или фокусирани варијанти на
ист пропозиционален содржај. Анализирајте ги секоја за: површинскиот
редослед на зборови (SVO, OVS и сл.), елементот во позиција на тема
(ако постои), елементот во позиција на фокус и каква дискурсна улога
би имал секој варијант вообичаено.

[Вметнете реченици]
Конструкција на релативни реченици
Идентификувајте ги сите релативни реченици во следниот текст.
За секоја, забележете: релативизираниот елемент, употребената стратегија
(wh-збор, релативна честичка „што", резумптивна заменка), именката-главица
и типот на реченицата (рестриктивна наспроти нерестриктивна).

[Вметнете текст]

5.3 Лексичка и семантичка анализа

Картирање на лексичко поле
Извлечете ги сите лексеми кои припаѓаат на семантичкото поле на
[наведете поле, на пр. „сродство", „земјоделски труд", „религиозна практика"]
од текстот подолу. За секоја лексема, дајте: македонска форма, превод
на англиски, зборовна класа и кратка забелешка за регистарот или
стилистичката вредност (разговорна, формална, архаична, дијалектна).

[Вметнете текст]
Анализа на заемки
Идентификувајте ги сите заемки во следниот текст. За секоја, дајте:
позајмената форма, јазикот-давател, веројатниот период на позајмување
(ако може да се утврди) и дали зборот бил фонолошки/морфолошки
интегриран во македонскиот јазик.

[Вметнете текст]
Следење на семантичка промена (историски текстови)
Следните два текста се од различни периоди (Текст А: [датум],
Текст Б: [датум]). Идентификувајте лексеми кои се јавуваат и во двата,
но покажуваат можни разлики во значењето, колокацијата или фреквенцијата.
Дискутирајте за потенцијалниот семантички дрифт.

Текст А: [вметнете]
Текст Б: [вметнете]

5.4 Фонолошка и правописна анализа

Акцент и фонотактика
Следните зборови се од транскрипт на дијалектно снимање.
Македонскиот литературен стандард има фиксен антепенултимативен акцент.
Идентификувајте ги зборовите каде транскрибираниот акцент (означен со ')
отстапува од правилото и класифицирајте го секое отстапување
(заемка, граматичка условеност, дијалектна задршка).

[Вметнете листа на зборови со означен акцент]
Анализа на правописни варијанти
Следниот текст изгледа дека е од предстандардизацискиот период
(пред 1945 г.). Идентификувајте ги правописните варијанти кои се
разликуваат од современиот литературен стандард и групирајте ги по тип:
разлики во фонолошката претстава, морфографски разлики и заемки
од српски/бугарски правописни конвенции.

[Вметнете текст]
Анализа на консонантски групи
Извлечете ги сите иницијални и финални консонантски групи од
следната листа на зборови. За секоја група: транскрибирајте ја на МФА,
забележете дали се придржува кон македонските ограничувања на слоговната
структура и означете ги оние кои укажуваат на потекло на заемки.

[Вметнете листа на зборови]

5.5 Дијалектолошка анализа

Идентификација на дијалектни карактеристики
Следниот текст е собран од говорник во [локација].
Идентификувајте ги сите карактеристики кои отстапуваат од литературниот
стандард. За секоја карактеристика, забележете: дијалектната форма,
стандардниот еквивалент, лингвистичкото ниво (фонолошко, морфолошко,
лексичко, синтаксичко) и со кој дијалектен ареал е обично поврзана
(западен, централен, источен, северен, јужен).

[Вметнете транскрибиран текст]
Картирање на изоглоси (компаративно)
Имам транскрипти од тројца говорници: Говорник А од Охрид,
Говорник Б од Штип и Говорник В од Куманово.
За лингвистичката варијабла [наведете, на пр. „реализација на јатовиот
рефлекс", „судбина на старата предна носна самогласка",
„аломорфи на определениот член"], извлечете ги сите релевантни токени
од секој транскрипт и споредете ги.

Говорник А: [вметнете]
Говорник Б: [вметнете]
Говорник В: [вметнете]

5.6 Социолингвистичка анализа

Анализа на регистар и стил
Споредете ги следните два текста: Текст А е од формален парламентарен
говор; Текст Б е од онлајн нишка на коментари, двата на македонски.
Анализирајте ги за: лексички маркери на формалност, синтаксичка сложеност
(стапка на субординација, должина на реченица), употреба на пасивни
конструкции, степен на стандардизација и секакво менување на кодови.

Текст А: [вметнете]
Текст Б: [вметнете]
Карактеристики на јазичен контакт
Следниот текст покажува контактни феномени меѓу македонскиот и
[наведете: албански, турски, ромски, српски и сл.].
Идентификувајте ги сите контактно индуцирани карактеристики: лексички
заемки, калки, шаблони на синтаксичка конвергенција и фонолошка
интерференција. Проценете ја секоја карактеристика според степенот
на нејзина интеграција во јазикот-примач.

[Вметнете текст]

5.7 Дискурсна и прагматичка анализа

Евиденцијалност и л-партицип
Во следниот нарациски текст, идентификувајте ги сите случаи каде
се употребува л-партицип (минато неопределено). За секој случај,
проценете: (а) дали директно/посведочено или индиректно/пренесено читање
е контекстуално поддржано, (б) нарациската улога на реченицата (позадина,
преден план, пренесен говор) и (в) дали е присутен или испуштен помошен
глагол и што тоа имплицира.

[Вметнете текст]
Кохезија и анафора
Анализирајте го следниот македонски параграф за кохезивни средства.
Картирајте ги сите реферирачки изрази: идентификувајте го воведениот
референт, стратегијата на иницијалното воведување (полно DP, неопределено,
сопствено име) и сите следни кореференцијални изрази (заменки, клитики,
нулта анафора, повторена ИГ, показна заменка).
Прикажете ги во анотирана табела со синџири на референција.

[Вметнете текст]

5.8 Историска и компаративна анализа

Континуитет од цсл. до македонски
Следниот текст е извадок од ракопис од 19. век напишан во хибриден
црковнословенско-македонски варијетет. Идентификувајте ги карактеристиките
кои се припишуваат на црковнословенската традиција и карактеристиките кои
го одразуваат современиот македонски народен говор, анотирајќи соодветно
секој збор или конструкција. Таму каде формата е двосмислена, забележете
ги двете можни атрибуции.

[Вметнете текст]
Компаративна јужнословенска анализа
Ќе дадам еквивалентни реченици на македонски, бугарски и српски.
Споредете ги за: употребената морфосинтаксичка стратегија
(аналитичка наспроти синтетичка за [наведете карактеристика]),
когнатни лексеми наспроти различни корени и типолошки разлики
во реченичната структура. Употребете формат со паралелна табела.

Македонски: [реченица]
Бугарски: [реченица]
Српски: [реченица]
Дел 06

Управување со повеќе проекти

Еден професионален лингвист обично работи на повеќе истражувачки теми истовремено. Организирајте ги вашите проекти така што секој претставува кохерентен, самостоен аналитички контекст.

Препорачана архитектура на проекти

Наместо еден огромен проект за „сета македонска лингвистичка работа", создавајте фокусирани проекти:

Назив на проектот Содржина на базата на знаење Фокус на инструкциите
МК Морфологија — Глаголски систем Глаголски корпус, извадоци од Конески, библиографија за вид Лајпцишко глосирање, табели на глаголски парадигми
МК Дијалекти — Западен регион Теренски транскрипти, дијалектни карти на Видоески, изоглоси Таксономија на дијалектни карактеристики, нестандардна анотација
МК-турски контактни феномени Двојазичен корпус, речници на заемки, контактни рамки Шема за класификација на заемки
МК Историски текстови 19. век Транскрипции на ракописи, цсл. референтни материјали Дијахрона анотација, означување на хибридни варијетети

Совети за навигација

  • Означете со ѕвезда вашиот најактивен проект за да се прикажува на врвот на листата.
  • Архивирајте ги завршените проекти (на пр. по поднесување на монографија) без бришење на податоците.
  • Чувајте ги поврзаните разговори во рамките на истиот проект — историјата на разговорите е корисна аналитичка евиденција.
Дел 07

Соработка и споделување

При претплатите Team и Enterprise, Claude Проектите поддржуваат вистинска соработка.

Споделување проект

  1. Отворете го проектот и кликнете „Share project" (до името на проектот).
  2. Додадете соработници по име или адреса на е-пошта.
  3. Доделете дозволи:
    • Can use: Соработникот може да ја чита базата на знаење, да ги гледа инструкциите и да почнува разговори, но не може да ги менува поставките.
    • Can edit: Соработникот може да ги ажурира инструкциите, да прикачува нови датотеки и да управува со дозволите на членовите.

Препорачани практики за лингвистички тимови

Определете менаџер на проект Одговорен за одржување на сопствените инструкции и базата на знаење. Некоординирани измени на инструкциите може да ја намалат аналитичката доследност.
Употребувајте ја историјата на разговорите како споделен дневник на анотација Кога ќе завршите анализа, дајте му на разговорот описен наслов (на пр. „Анализа на вид — корпус на народни раскази, Сесија 3"). Вашите соработници можат да ја читаат и да градат врз неа.
Договорете се за терминологијата пред прикачување на речник Ако вашиот тим има постоечки интерен прирачник за анотација, прикачете го во базата на знаење за Claude да применува доследна терминологија за сите членови.
Заеднички прегледувајте ги и усовршувајте ги инструкциите Периодично нека сите членови ги тестираат инструкциите со примерни текстови и дискутираат за несовпаѓањата во излезите на Claude.
Дел 08

Добри практики и чести грешки

Добри практики

Дајте конкретен анотиран пример Апстрактните описи на вашата шема за анотација се помалку сигурни отколку една добро анотирана примерна реченица. Вклучете ја во инструкциите или базата на знаење.
Барајте означување на неизвесност Вклучете во инструкциите: „Кога анализата е навистина двосмислена, изречно означете го тоа со [НЕИЗВЕСНО: причина] наместо молчум да изберете едно толкување."
Употребувајте структурирани формати на излез Барајте табели, блокови на интерлинеарни глоси или нумерирани листи доследно. Структурираниот излез полесно се копира во вашиот софтвер за анотација.
Потврдувајте ги анализите на Claude Секогаш проверувајте ги анализите со вашата сопствена стручност и референтни граматики пред да ги употребите во објавени трудови.
Разделете ги задачите во посебни разговори Не барајте морфолошка анотација, синтаксичка анализа и дискурсно резиме сите во еден разговор. Почнете нов разговор за секоја поединечна аналитичка задача.
Одржувајте ја базата на знаење актуелна Ако ги ажурирате упатствата за анотација, избришете ја старата датотека и прикачете ја поправената верзија.

Чести грешки

Презаситување на инструкциите Инструкциите кои се премногу долги и внатрешно противречни збунуваат наместо да насочуваат. Поедноставете ги и додавајте прецизност само таму каде тоа е најважно.
Мешање на знаење на проектот со прикачувања во разговорот Датотеките прикачени директно во разговор се достапни само за тој разговор. За постојана достапност, прикачете ги во базата на знаење.
Претпоставување длабока познавање на македонската дијалектологија Claude има општо познавање на македонскиот јазик, но покриеноста на дијалектите, ракописните традиции и специјализираната литература е помалку длабока отколку за главните светски јазици. Прикачувајте повеќе референтен материјал.
Непрецизирање на очекувањата за кирилско писмо Ако сакате излез на кирилица, кажете тоа изречно. Claude може да употребува и латинска транслитерација или МФА — наведете кој систем ви е потребен.
Третирање на излезот на Claude како конечен Claude е истражувачки асистент, не авторитативна алатка. За нијансирани случаи — евиденцијалност, вид, дијалектна атрибуција — третирајте го излезот како хипотеза за потврдување.
Дел 09

Примери на шаблони за проекти

Следните шаблони за инструкции на проекти се готови за употреба. Копирајте ги и прилагодете ги за вашите конкретни истражувачки потреби.

А Општ проект за анотација на македонски корпус
Им помагате на професионален лингвист кој работи на македонска
корпусна лингвистика.

ЈАЗИК: Стандарден современ македонски јазик (литературен стандард).
Означете ги нестандардните и дијалектните форми изречно наместо
да ги нормализирате.

АНАЛИТИЧКИ ЗАДАЧИ кои може да ви се постават:
- Морфолошка анотација (PoS означување + флексиски карактеристики)
- Опис на синтаксичка структура
- Лексичка категоризација и глосирање
- Идентификација на контактни феномени

ФОРМАТ НА АНОТАЦИЈА:
Употребувајте формат на интерлинеарна глоса (Лајпцишки правила
за глосирање) за морфолошка анотација. Употребувајте табели за
компаративни или фреквентни податоци.
Употребувајте нумерирани листи за набројување карактеристики.

ЈАЗИК НА ИЗЛЕЗОТ: Англиски, освен ако не барам македонски.

НЕИЗВЕСНОСТ: Секогаш означувајте ги неизвесните или двосмислени
анализи со [ЗАБЕЛЕШКА: причина]. Никогаш не погодувајте молчум.

КИРИЛИЦА: Секогаш зачувувајте ја оригиналната кирилска правопис
во вашиот излез.
Б Дијалектолошка теренска анализа
Им помагате на дијалектолог кој работи со примарни теренски
податоци од македонски говорни заедници.

ТИП НА ПОДАТОЦИ: Транскрибиран изговорен јазик од теренски интервјуа.
Транскрипциите следат [наведете ја вашата конвенција, на пр.
„стандардна македонска правопис со дијакритики за нестандардни самогласки"].

АНАЛИТИЧКИ ФОКУС:
За секој текст или извадок кој го давам, идентификувајте:
1. Фонолошки карактеристики кои отстапуваат од литературниот стандард
2. Морфолошки карактеристики (особено глаголски наставки, форми на
   клитики, аломорфи на членот)
3. Лексички единици кои се дијалектни, архаични или отсутни од
   стандардните македонски речници
4. Синтаксички конструкции кои не се наоѓаат во литературниот стандард

КЛАСИФИКАЦИЈА НА ДИЈАЛЕКТНИ АРЕАЛИ:
Западен (Охридско-Струшки, Кичевско-Поречки), Централен (Велешко-Тиквешки),
Источен (Штипско-Кочански, Малешевски), Северен (Кумановско-Скопска Crna
Gora), Јужен (Битолско-Преспански, Костурско-Корчански ако е применливо).

ФОРМАТ НА ИЗЛЕЗ: Структурирана табела со колони:
[Карактеристика] | [Дијалектна форма] | [Стандарден еквивалент] |
[Лингвистичко ниво] | [Атрибуција на дијалектен ареал] | [Забелешки]

НЕИЗВЕСНОСТ: Означете ги неатрибуираните карактеристики со
[НЕАТРИБУИРАНО] и додадете забелешка.
В Историски македонски текстови
Им помагате на филолог кој работи со македонски текстови од
19. век, вклучувајќи ракописни традиции, литература на преродбата
и рани печатени публикации.

ТЕКСТОВИ: Предстандардизациски македонски, кој покажува варијација
меѓу црковнословенската традиција, народните македонски карактеристики
и влијанието на бугарските и српските книжевни норми на тој период.

АНАЛИТИЧКИ ПРИСТАП:
Кога ќе ви презентирам текст, дајте:
1. Дипломатска транскрипциска забелешка (секои уредувачки одлуки)
2. Идентификација на елементите на црковнословенски (означете: [ЦСЛ])
3. Идентификација на народни македонски карактеристики (означете: [МК-нар])
4. Идентификација на српско или бугарско книжевно влијание ([СРП]/[БУГ])
5. Лексички глоси за архаичен или специјализиран речник
6. Кратко резиме на јазичниот карактер на текстот
   (каде стои на континуумот цсл.–народен говор)

ПРАВОПИС: Забележете кој правописен систем е употребен
(предреформна српска кирилица, бугарска правописна традиција,
експериментални писма од времето на Илинден) и коментирајте за
неговите импликации за фонолошката интерпретација.

ЈАЗИК НА ИЗЛЕЗОТ: Англиски, со зачувани оригинални кирилски форми.