MediaWiki:Wikificator.js — различия между версиями

Материал из ПокеВики
Перейти к: навигация, поиск
м
 
Строка 1: Строка 1:
var wmCantWork = 'Викификатор не может работать в вашем браузере.\n\nWikificator can not work in your browser.' // English, for those unable to see Cyrillic characters
+
// основано на википедийном викификаторе; последние 5 авторов Alex Smotrov, Putnik, Kalan, Александр Сигачёв, Solon; условия распространения - GFDL; ссылка на источник http://ru.wikipedia.org/wiki/MediaWiki:Wikificator.js
 +
var wmVersion = '2010-04-03'
 +
var wmCantWork = 'Викификатор не может работать в вашем браузере\n\nWikificator can not work in your browser'
 
var wmFullText = 'Викификатор обработает ВЕСЬ текст на этой странице. Продолжить?'
 
var wmFullText = 'Викификатор обработает ВЕСЬ текст на этой странице. Продолжить?'
var wmTalkPage = 'Викификатор не обрабатывает страницы обсуждения целиком.\n\nВыделите ваше сообщение — обработано будет только оно.'
+
var wmTalkPage = 'Викификатор не обрабатывает страницы обсуждения целиком.\n\nВыделите ваше сообщение — обработано будет только оно'
  
 +
function Wikify(){
 +
var txt='', hidden = [], wpTextbox1 = document.editform.wpTextbox1
 +
var winScroll = document.documentElement.scrollTop
  
function Wikify(){
+
try {txt='ая'.replace(/а/g,'б').replace(/б(?=я)/,'в')} catch(e){}//check regexp support
if (('code'.replace(/d/g, 'r') != 'core') //check regexp support
+
if (txt != 'вя' ||  
    || (navigator.appName=='Netscape' && navigator.appVersion.substr (0, 1) < 5))
+
  (navigator.appName=='Netscape' && navigator.appVersion.substr (0, 1) < 5))
 
   { alert(wmCantWork); return }
 
   { alert(wmCantWork); return }
  
var txt, hidden = [], hidIdx = -1, wpTextbox1 = document.editform.wpTextbox1
 
var winScroll = document.documentElement.scrollTop //remember window scroll
 
 
  wpTextbox1.focus()
 
  wpTextbox1.focus()
  
 
  if (typeof wpTextbox1.selectionStart != 'undefined'  
 
  if (typeof wpTextbox1.selectionStart != 'undefined'  
     && (navigator.productSub > 20031000 || is_safari)) { //Mozilla/Opera/Safari3
+
     && (navigator.productSub > 20031000 || is_safari || is_opera)) { //Mozilla/Opera/Safari3
 
     var textScroll = wpTextbox1.scrollTop
 
     var textScroll = wpTextbox1.scrollTop
 
     var startPos = wpTextbox1.selectionStart
 
     var startPos = wpTextbox1.selectionStart
Строка 48: Строка 51:
  
 
function processAllText(){
 
function processAllText(){
  txt = '\n' + wpTextbox1.value
+
  txt = wpTextbox1.value
 +
if (txt=='version') alert('Викификатор '+wmVersion)
 
  processText()
 
  processText()
 
  r(/^[\n\r]+/, '')
 
  r(/^[\n\r]+/, '')
 
  wpTextbox1.value = txt
 
  wpTextbox1.value = txt
 
  txt = ''
 
  txt = ''
  if (window.auto_comment && window.insertSummary) insertSummary('викификатор')
+
  if (window.auto_comment && window.insertSummary && !document.editform.wpSection.value)
 +
  insertSummary('викификатор')
 
}
 
}
  
 
function processText(){
 
function processText(){
+
 
 
var u = '\u00A0' //unbreakable space
 
var u = '\u00A0' //unbreakable space
 
if (wgNamespaceNumber % 2 || wgNamespaceNumber==4) { //is talk page
 
if (wgNamespaceNumber % 2 || wgNamespaceNumber==4) { //is talk page
Строка 73: Строка 78:
 
hideTag('tt')
 
hideTag('tt')
 
hideTag('math')
 
hideTag('math')
 +
r(/( |\n|\r)+\{\{(·|•|\*)\}\}/g, '{{$2}}'); //before {{·/•/*}}, usually in templates
 +
hide(/{\{[\s\S]+?}}/g)//templates
 +
hide(/^ .*/mg)
 +
hide(/(https?|ftp|news|nntp|telnet|irc|gopher):\/\/[^\s\[\]<>"]+ ?/gi)
 +
hide(/^#(redirect|перенапр(авление)?)/i)
 
hideTag('gallery')
 
hideTag('gallery')
hide('{\\{[\\s\\S]+?}}') //templates
 
hide('^ .*') //lines starting with space
 
hide('(http|https|ftp|tftp|news|nntp|telnet|irc|gopher)://[^ \n\r\u00A0]* ?') //links
 
hide('^#(redirect|перенапр(авление)?)')
 
  
 +
 +
r(/ +(\n|\r)/g,'$1')//spaces at EOL
 +
txt = '\n'+txt+'\n'
 +
 +
 +
 +
//LINKS
 
r(/(\[\[:?)(category|категория):( *)/ig, '$1Категория:')
 
r(/(\[\[:?)(category|категория):( *)/ig, '$1Категория:')
 
r(/(\[\[:?)(image|изображение|file):( *)/ig, '$1Файл:')
 
r(/(\[\[:?)(image|изображение|file):( *)/ig, '$1Файл:')
// Year and century ranges
+
//Linked years, centuries and ranges
r(/(?!ISBN)(\(|\s)(\[\[[12]?\d{3}\]\])[\u00A0 ]?(-{1,3}|–|—) ?(\[\[[12]?\d{3}\]\])(\W)/g, '$1$2—$4$5')
+
r(/(\(|\s)(\[\[[12]?\d{3}\]\])[\u00A0 ]?(-{1,3}|–|—) ?(\[\[[12]?\d{3}\]\])(\W)/g, '$1$2—$4$5')
 
r(/(\[\[[12]?\d{3}\]\]) ?(гг?\.)/g, '$1'+u+'$2')
 
r(/(\[\[[12]?\d{3}\]\]) ?(гг?\.)/g, '$1'+u+'$2')
 
r(/(\(|\s)(\[\[[IVX]{1,5}\]\])[\u00A0 ]?(-{1,3}|–|—) ?(\[\[[IVX]{1,5}\]\])(\W)/g, '$1$2—$4$5')
 
r(/(\(|\s)(\[\[[IVX]{1,5}\]\])[\u00A0 ]?(-{1,3}|–|—) ?(\[\[[IVX]{1,5}\]\])(\W)/g, '$1$2—$4$5')
 
r(/(\[\[[IVX]{1,5}\]\]) ?(вв?\.)/g, '$1'+u+'$2')
 
r(/(\[\[[IVX]{1,5}\]\]) ?(вв?\.)/g, '$1'+u+'$2')
 
+
r(/\[\[(\d+)\]\]\sгод/g, '[[$1'+u+'год]]')
// Year and century links
+
r(/\[\[(\d+)\sгод\|\1\]\]\sгод/g, '[[$1'+u+'год]]')
r(/\[\[(\d+)\]\][\u00A0 ]год/g, '[[$1 год]]')
+
r(/\[\[(\d+)\sгод\|\1\sгод([а-я]{0,3})\]\]/g, '[[$1'+u+'год]]$2')
r(/\[\[((\d+)(?: (?:год )?в [\wa-яёА-ЯЁ ]+\|\2)?)\]\][\u00A0 ](год[а-яё]*)/g, '[[$1\u00A0$3]]')
+
r(/\[\[((\d+)(?: (?:год )?в [\wa-яёА-ЯЁ ]+\|\2)?)\]\][\u00A0 ](год[а-яё]*)/g, '[[$1'+u+'$3]]')
r(/\[\[([XVI]+)\]\][\u00A0 ]век/g, '[[$1 век]]')
+
r(/\[\[([XVI]+)\]\]\sвек/g, '[[$1'+u+'век]]')
r(/\[\[(([XVI]+) век\|\2)\]\][\u00A0 ]век/g, '[[$2 век]]')
+
r(/\[\[([XVI]+)\sвек\|\1\]\]\sвек/g, '[[$1'+u+'век]]')
+
r(/\[\[([XVI]+)\sвек\|\1\sвек([а-я]{0,3})\]\]/g, '[[$1'+u+'век]]$2')
 +
r(/\[\[(([XVI]+) век\|\2)\]\][\u00A0 ]век/g, '[[$2'+u+'век]]')
 
// Nice links
 
// Nice links
r(/(\[\[[^|\[\]:]*)[\u00AD\u200E\u200F]+([^\[\]]*\]\])/g, '$1$2') // Soft Hyphen & DirMark
+
r(/(\[\[[^|\[\]]*)[\u00AD\u200E\u200F]+([^\[\]]*\]\])/g, '$1$2') // Soft Hyphen & DirMark
r(/\[\[ *([a-zA-Zа-яёА-ЯЁ\u00A0-\u00FF %!\"$&'()*,\-.\/0-9:;=?\\@\^_`’~]+) *\| *(\1)([a-zа-яё]*) *\]\]/g, '[[$2]]$3') // "
+
r(/\[\[ *([a-zA-Zа-яёА-ЯЁ\u00A0-\u00FF %!\"$&'()*,\-.\/0-9:;=?\\@\^_`’~]+) *\| *(\1)([a-zа-яё]*) *\]\]/g, '[[$2]]$3') // "
r(/\[\[ *([a-zA-Zа-яёА-ЯЁ\u00A0-\u00FF %!\"$&'()*,\-.\/0-9:;=?\\@\^_`’~]+) *\| *([^|[\]]+) *\]\]([a-zа-яё]+)/g, '[[$1|$2$3]]') // "
+
r(/\[\[ *([^|\[\]]+)([^|\[\]]+) *\| *\1 *\]\]\2/g, '[[$1$2]]') // -повтор текста за ссылкой
 
+
r(/\[\[ *(?!Файл:|Категория:)([a-zA-Zа-яёА-ЯЁ\u00A0-\u00FF %!\"$&'()*,\-.\/0-9:;=?\\@\^_`’~]+) *\| *([^|[\]]+) *\]\]([a-zа-яё]+)/g, '[[$1|$2$3]]') // "
hide('\\[\\[[^\\]|]+') //internal links
+
hide(/\[\[[^\]|]+/g)//only link part
  
r(/<<(\S.+\S)>>/g, '"$1"') //<<text>> -> "text"
 
//square and cube
 
r(/(<sup>2<\/sup>|&sup2;)/gi, '²');
 
r(/(<sup>3<\/sup>|&sup3;)/gi, '³');
 
//tags → wikicode
 
r(/<\/?(b|strong)>/gi, "'''")
 
r(/<\/?(i|em)>/gi, "''")
 
r(/<hr ?\/?>/gi, '----')
 
//improve hr and br
 
r(/<(hr|br)( [^\/>]+?)? ?\/?>/gi, '<$1$2 />')
 
//№№ → №
 
r(/№№/g,'№')
 
  
 +
//TAGS
 +
r(/<<(\S.+\S)>>/g, '"$1"') //<< >>
 +
r(/(sup>|sub>|\s)-(\d)/g, '$1−$2') //minus
 +
r(/&sup2;/gi, '²')
 +
r(/&sup3;/gi, '³')
 +
r(/<(b|strong)>(.*?)<\/(b|strong)>/gi,"'''$2'''")
 +
r(/<(i|em)>(.*?)<\/(i|em)>/gi,"''$2''")
 +
r(/^<hr ?\/?>/gim, '----')
 +
r(/<\/?(hr|br)( [^\/>]+?)? ?\/?>/gi, '<$1$2 />')
 +
r(/(\n== *[a-zа-я\s\.:]+ *==\n+)<references *\/>/ig,'$1{\{примечания}}')
 +
hide(/<[a-z][^>]*?>/gi)
  
hide('<[^>]*?>') //tags
+
hide(/^({\||\|-).*/mg)//table/row def
hide('\\w+ *= *"[^"]*"') //tables attributes
+
hide(/(^\||^!|!!|\|\|) *[a-z]+=[^|]+\|(?!\|)/mgi)//cell style
 +
hide(/\| +/g)//formatted cell
  
r(/(\S)[ \t]+( |\n|\r)/g,'$1$2') //remove double spaces and spaces at EOL
+
r(/[ \t]+/g,' ')//double spaces
r(/^([#*:]+)[ \t\f\v]*([^ \t\f\v*#:;])/gm, '$1 $2') //space after #*: at the line start
 
 
 
// Entities
 
r(/&#(\d+);/g, function(n,a){return String.fromCharCode(a)})                        //&#769;
 
r(/&#x([0-9a-f]{1,4});/gi, function(n,a){return String.fromCharCode(eval('0x'+a.substr(-4)))})  //&#x301;
 
  
 
// Headings
 
// Headings
r(/^(=+)[ \t\f\v]*(.*?)[ \t\f\v]*=+$/gm, '$1 $2 $1') //add spaces in section headers
+
r(/^(=+)[ \t\f\v]*(.*?)[ \t\f\v]*=+$/gm, '$1 $2 $1') //add spaces inside
r(/([^\r\n])(\r?\n==.*==\r?\n)/g, '$1\n$2') //add empty line before section header
+
r(/([^\r\n])(\r?\n==.*==\r?\n)/g, '$1\n$2') //add empty line before
r(/^== (С|с)м(\.?|отрите) ?также ==$/gm, '== См. также ==')
+
r(/^== см(\.?|отри|отрите) ?также ==$/gmi, '== См. также ==')
r(/^== (С|с)носки ==$/gm, '== Примечания ==')
+
r(/^== сноски ==$/gmi, '== Примечания ==')
 +
r(/^== внешние\sссылки ==$/gmi, '== Ссылки ==')
 
r(/^== (.+)[.:] ==$/gm, '== $1 ==')
 
r(/^== (.+)[.:] ==$/gm, '== $1 ==')
  
 +
r(/«|»|“|”|„/g, '"')//temp
  
// Temporary replacements
 
r(/–/g, '-')
 
r(/«|»|“|”|„/g, '"')
 
txt = ' ' + txt
 
 
// Minus handler
 
r(/(sup>|sub>|\s)-(\d)/g, '$1−$2')
 
 
// Hyphens and en dashes to pretty dashes
 
// Hyphens and en dashes to pretty dashes
r(/&(#151|[nm]dash);/g, '—')
+
r(/–/g, '-') //&ndash; ->  hyphen
r(/(&nbsp;|[\f\n\r\t\v\u00A0\u2028\u2029])(-{1,3}|–) /g, '$1— ')
+
r(/&(#151|[nm]dash);/g, '—') // -> &mdash;
r(/(\d)--(\d)/g, '$1—$2')
+
r(/(&nbsp;|\s)-{1,3} /g, '$1— ') // hyphen -> &mdash;
 +
r(/(\d)--(\d)/g, '$1—$2') // -> &mdash;
  
 
// Entities etc. → Unicode chars
 
// Entities etc. → Unicode chars
 +
r(/&#x([0-9a-f]{1,4});/gi, function(n,a){return String.fromCharCode(eval('0x'+a.substr(-4)))})  //&#x301;
 
r(/&copy;/gi,'©')
 
r(/&copy;/gi,'©')
 
r(/&reg;/gi,'®')
 
r(/&reg;/gi,'®')
Строка 152: Строка 158:
 
r(/&pound;/gi,'£')
 
r(/&pound;/gi,'£')
 
r(/&deg;/g,'°')
 
r(/&deg;/g,'°')
r(/\(tm\)|\(тм\)|&trade;/gi,'™')
+
r(/\(tm\)|&trade;/gi,'™')
 
r(/\.\.\.|&hellip;/g,'…')
 
r(/\.\.\.|&hellip;/g,'…')
r(/\+[--]|&plusmn;/g,'±')
+
r(/\+-(?!\+|-)|&plusmn;/g,'±')
 
r(/~=/g,'≈')
 
r(/~=/g,'≈')
 
r(/\^2(\D)/g,'²$1')
 
r(/\^2(\D)/g,'²$1')
Строка 160: Строка 166:
 
r(/&((la|ra|bd|ld)quo|quot);/g,'"')
 
r(/&((la|ra|bd|ld)quo|quot);/g,'"')
 
r(/([\wа-яА-ЯёЁ])'([\wа-яА-ЯёЁ])/g,'$1’$2') //'
 
r(/([\wа-яА-ЯёЁ])'([\wа-яА-ЯёЁ])/g,'$1’$2') //'
 +
r(/№№/g,'№')
  
 
// Year and century ranges
 
// Year and century ranges
r(/(\(|\s)([12]?\d{3})[\u00A0 ]?(-{1,3}|–|—) ?([12]?\d{3})(\W)/g, '$1$2—$4$5')
+
r(/(\(|\s)([12]?\d{3})[\u00A0 ]?(-{1,3}|—) ?([12]?\d{3})(?![\w-])/g, '$1$2—$4')
 
r(/([12]?\d{3}) ?(гг?\.)/g, '$1'+u+'$2')
 
r(/([12]?\d{3}) ?(гг?\.)/g, '$1'+u+'$2')
r(/(\(|\s)([IVX]{1,5})[\u00A0 ]?(-{1,3}|–|—) ?([IVX]{1,5})(\W)/g, '$1$2—$4$5')
+
r(/(\(|\s)([IVX]{1,5})[\u00A0 ]?(-{1,3}|—) ?([IVX]{1,5})(?![\w-])/g, '$1$2—$4')
 
r(/([IVX]{1,5}) ?(вв?\.)/g, '$1'+u+'$2')
 
r(/([IVX]{1,5}) ?(вв?\.)/g, '$1'+u+'$2')
  
 
// Reductions
 
// Reductions
r(/(Т|т)\. ?е\./g, '$1о есть')
+
r(/(Т|т)\.\s?е\./g, '$1о есть')
r(/(Т|т)\. ?к\./g, '$1ак как')
+
r(/(Т|т)\.\s?к\./g, '$1ак как')
r(/(В|в) т\. ?ч\./g, '$1 том числе')
+
r(/(В|в)\sт\. ?ч\./g, '$1 том числе')
r(/и т\. ?д\./g, 'и'+u+'т\.'+u+'д\.')
+
r(/(И|и)\sт\.\s?д\./g, '$1'+u+'т\.'+u+'д\.')
r(/и т\. ?п\./g, 'и'+u+'т\.'+u+'п\.')
+
r(/(И|и)\sт\.\s?п\./g, '$1'+u+'т\.'+u+'п\.')
r(/(Т|т)\. ?н\./g, '$1\.'+u+'н\.')
+
r(/(Т|т)\.\s?н\./g, '$1\.'+u+'н\.')
r(/н\. ?э\./g, 'н\.'+u+'э\.')
+
r(/(И|и)\.\s?о\./g, '$1\.'+u+'о\.')
r(/(Д|д)(о|\.) н\. ?э\./g, '$1о'+u+'н\.'+u+'э\.')
+
r(/н\.\s?э\./g, 'н\.'+u+'э\.')
r(/(\d)[\u00A0 ]?(млн|млрд|трлн|(?:м|с|д|к)?м|[км]г)\.?( ([^\.А-ЯЁ\d])|[,;.])(?!\[.*?\|[А-Я].*?\])/g, '$1'+u+'$2$3')
+
r(/(Д|д)(о|\.)\sн\.\s?э\./g, '$1о'+u+'н\.'+u+'э\.')
 +
r(/(\d)[\u00A0 ]?(млн|млрд|трлн|(?:м|с|д|к)?м|[км]г)\.?(?=[,;.]| "?[а-яё-])/g, '$1'+u+'$2')
 
r(/(\d)[\u00A0 ](тыс)([^\.А-Яа-яЁё])/g, '$1'+u+'$2.$3')
 
r(/(\d)[\u00A0 ](тыс)([^\.А-Яа-яЁё])/g, '$1'+u+'$2.$3')
 +
r(/ISBN:\s?(?=[\d\-]{8,17})/,'ISBN ')
  
 
// Insert/delete spaces
 
// Insert/delete spaces
r(/(\S) (-{1,3}|–|—) (\S)/g, '$1'+u+'— $3')
+
r(/^([#*:]+)[ \t\f\v]*(?!\{\|)([^ \t\f\v*#:;])/gm, '$1 $2') //space after #*: unless before table
 +
r(/(\S) (-{1,3}|—) (\S)/g, '$1'+u+'— $3')
 
r(/([А-Я]\.) ?([А-Я]\.) ?([А-Я][а-я])/g, '$1'+u+'$2'+u+'$3')
 
r(/([А-Я]\.) ?([А-Я]\.) ?([А-Я][а-я])/g, '$1'+u+'$2'+u+'$3')
 
r(/([А-Я]\.)([А-Я]\.)/g, '$1 $2')
 
r(/([А-Я]\.)([А-Я]\.)/g, '$1 $2')
Строка 191: Строка 201:
 
r(/\( +/g, '('); r(/ +\)/g, ')') //inside ()
 
r(/\( +/g, '('); r(/ +\)/g, ')') //inside ()
  
// Temperature
+
//Temperature
r(/([ =≈≠≤≥<>("'|]|^)([+±−\-]?\d+?(?:[.,]\d+?)?)(([ °^*]| [°^*])[CС])(?=[ "').,;!?|]|$)/gm, '$1$2'+u+'°C') //'
+
r(/([\s\d=≈≠≤≥<>("'|])([+±−-]?\d+?(?:[.,]\d+?)?)(([ °^*]| [°^*])C)(?=[\s"').,;!?|])/gm, '$1$2'+u+'°C') //'
r(/([ =≈≠≤≥<>("'|]|^)([+±−\-]?\d+?(?:[.,]\d+?)?)(([ °^*]| [°^*])F)(?=[ "').,;|!?]|$)/gm, '$1$2'+u+'°F') //'
+
r(/([\s\d=≈≠≤≥<>("'|])([+±−-]?\d+?(?:[.,]\d+?)?)(([ °^*]| [°^*])F)(?=[\s"').,;|!?])/gm, '$1$2'+u+'°F') //'
  
// Dot → comma in numbers
+
//Dot → comma in numbers
 
r(/(\s\d+)\.(\d+[\u00A0 ]*[%‰°])/gi, '$1,$2')
 
r(/(\s\d+)\.(\d+[\u00A0 ]*[%‰°])/gi, '$1,$2')
  
// "" → «»
+
//"" → «»
r(/([\x01-("\s|+\/\-])"([^"]*)([^\s"(|])"/g, '$1«$2$3»') //"
+
for (var i=1; i<=2; i++)
if (/"/.test(txt)){ //quotes inside "
+
r(/([\s\x02!|#'"\/(;+-])"([^"]*)([^\s"(|])"([^a--яё])/ig, '$1«$2$3»$4') //"
  r(/([\x01-("\s|\-])"([^"]*)([^\s"(|])"/g, '$1«$2$3»') //"
+
while (/«[^»]*«/.test(txt))  
  while (/«[^»]*«/.test(txt))
+
r(/«([^»]*)«([^»]*)»/g, '«$1„$2“')
    r(/«([^»]*)«([^»]*)»/g, '«$1„$2“')
 
}
 
 
 
txt = txt.substr(1) // leading space
 
  
restoreAll()
+
txt=txt.substr(1, txt.length-2)
 +
if ('0'.replace('0','$$') == '$') ////$ in replacing string is special, except in IE
 +
for (var i=0; i<hidden.length; i++) hidden[i] = hidden[i].replace(/\$/g, '$$$$')
 +
while (hidden.length>0)
 +
r('\x01'+hidden.length+'\x02', hidden.pop())
  
 
}
 
}
 
  
 
function r(r1, r2){ txt = txt.replace(r1, r2) }
 
function r(r1, r2){ txt = txt.replace(r1, r2) }
 
+
function hide(re){ r(re, function(s){return '\x01'+hidden.push(s)+'\x02'})}
function hide(expr){
+
function hideTag(tag){ hide(RegExp('<' + tag + '( [^>]+)?>[\\s\\S]+?<\\/' + tag + '>','gi')) }
r(RegExp(expr, 'mgi'), function(s){
 
  if ('0'.replace('0','$$') == '$') s = s.replace(/\$/g, '$$$$')//$ in string is special, except in IE
 
  hidden[++hidIdx] = s
 
  return '\x01' + hidIdx + '\x02'
 
})
 
}
 
 
 
function hideTag(tag){
 
  hide('<' + tag + '( [^>]+)?>[\\s\\S]+?<\\/' + tag + '>')
 
}
 
 
 
function restoreAll(){
 
for (var i=hidIdx; i>=0; i--) r('\x01' + i + '\x02', hidden[i])
 
}
 
  
 
}
 
}

Текущая версия на 22:25, 3 июля 2011

// основано на википедийном викификаторе; последние 5 авторов Alex Smotrov, Putnik, Kalan, Александр Сигачёв, Solon; условия распространения - GFDL; ссылка на источник http://ru.wikipedia.org/wiki/MediaWiki:Wikificator.js
var wmVersion = '2010-04-03'
var wmCantWork = 'Викификатор не может работать в вашем браузере\n\nWikificator can not work in your browser'
var wmFullText = 'Викификатор обработает ВЕСЬ текст на этой странице. Продолжить?'
var wmTalkPage = 'Викификатор не обрабатывает страницы обсуждения целиком.\n\nВыделите ваше сообщение — обработано будет только оно'

function Wikify(){
 var txt='', hidden = [], wpTextbox1 = document.editform.wpTextbox1
 var winScroll = document.documentElement.scrollTop

 try {txt='ая'.replace(/а/g,'б').replace(/б(?=я)/,'в')} catch(e){}//check regexp support
 if (txt != 'вя' || 
  (navigator.appName=='Netscape' && navigator.appVersion.substr (0, 1) < 5))
  { alert(wmCantWork); return }

 wpTextbox1.focus()

 if (typeof wpTextbox1.selectionStart != 'undefined' 
    && (navigator.productSub > 20031000 || is_safari || is_opera)) { //Mozilla/Opera/Safari3
    var textScroll = wpTextbox1.scrollTop
    var startPos = wpTextbox1.selectionStart
    var endPos = wpTextbox1.selectionEnd
    txt = wpTextbox1.value.substring(startPos, endPos)
    if (txt == '') processAllText()
    else{
      processText()
      wpTextbox1.value = wpTextbox1.value.substring(0, startPos) + txt + wpTextbox1.value.substring(endPos)
    }
    wpTextbox1.selectionStart = startPos
    wpTextbox1.selectionEnd = startPos + txt.length
    wpTextbox1.scrollTop = textScroll

 }else if (document.selection && document.selection.createRange) { //IE
   var range = document.selection.createRange()
   txt = range.text
   if (txt == '') processAllText()
   else{
     processText()
     range.text = txt
     if (range.moveStart) range.moveStart('character', - txt.length)
     range.select() 
   }
  
 }else // other browsers
   if (confirm(wmFullText)) processAllText()

 document.documentElement.scrollTop = winScroll // scroll back, for IE/Opera


//functions

function processAllText(){
 txt = wpTextbox1.value
 if (txt=='version') alert('Викификатор '+wmVersion)
 processText()
 r(/^[\n\r]+/, '')
 wpTextbox1.value = txt
 txt = ''
 if (window.auto_comment && window.insertSummary && !document.editform.wpSection.value)
   insertSummary('викификатор')
}

function processText(){

var u = '\u00A0' //unbreakable space
if (wgNamespaceNumber % 2 || wgNamespaceNumber==4) { //is talk page
 u = ' '
 var sigs = txt.match(/\d\d:\d\d, \d\d? \S{3,8} 20\d\d \(UTC\)/g)
 if (sigs && sigs.length > 1) {
   alert(wmTalkPage); return
 }
}

hideTag('nowiki')
hideTag('pre')
hideTag('source')
hideTag('code')
hideTag('tt')
hideTag('math')
r(/( |\n|\r)+\{\{(·|•|\*)\}\}/g, '{{$2}}'); //before {{·/•/*}}, usually in templates
hide(/{\{[\s\S]+?}}/g)//templates
hide(/^ .*/mg)
hide(/(https?|ftp|news|nntp|telnet|irc|gopher):\/\/[^\s\[\]<>"]+ ?/gi)
hide(/^#(redirect|перенапр(авление)?)/i)
hideTag('gallery')


r(/ +(\n|\r)/g,'$1')//spaces at EOL
txt = '\n'+txt+'\n'



//LINKS
r(/(\[\[:?)(category|категория):( *)/ig, '$1Категория:')
r(/(\[\[:?)(image|изображение|file):( *)/ig, '$1Файл:')
//Linked years, centuries and ranges
r(/(\(|\s)(\[\[[12]?\d{3}\]\])[\u00A0 ]?(-{1,3}|–|—) ?(\[\[[12]?\d{3}\]\])(\W)/g, '$1$2—$4$5')
r(/(\[\[[12]?\d{3}\]\]) ?(гг?\.)/g, '$1'+u+'$2')
r(/(\(|\s)(\[\[[IVX]{1,5}\]\])[\u00A0 ]?(-{1,3}|–|—) ?(\[\[[IVX]{1,5}\]\])(\W)/g, '$1$2—$4$5')
r(/(\[\[[IVX]{1,5}\]\]) ?(вв?\.)/g, '$1'+u+'$2')
r(/\[\[(\d+)\]\]\sгод/g, '[[$1'+u+'год]]')
r(/\[\[(\d+)\sгод\|\1\]\]\sгод/g, '[[$1'+u+'год]]')
r(/\[\[(\d+)\sгод\|\1\sгод([а-я]{0,3})\]\]/g, '[[$1'+u+'год]]$2')
r(/\[\[((\d+)(?: (?:год )?в [\wa-яёА-ЯЁ ]+\|\2)?)\]\][\u00A0 ](год[а-яё]*)/g, '[[$1'+u+'$3]]')
r(/\[\[([XVI]+)\]\]\sвек/g, '[[$1'+u+'век]]')
r(/\[\[([XVI]+)\sвек\|\1\]\]\sвек/g, '[[$1'+u+'век]]')
r(/\[\[([XVI]+)\sвек\|\1\sвек([а-я]{0,3})\]\]/g, '[[$1'+u+'век]]$2')
r(/\[\[(([XVI]+) век\|\2)\]\][\u00A0 ]век/g, '[[$2'+u+'век]]')
// Nice links
r(/(\[\[[^|\[\]]*)[\u00AD\u200E\u200F]+([^\[\]]*\]\])/g, '$1$2') // Soft Hyphen & DirMark
r(/\[\[ *([a-zA-Zа-яёА-ЯЁ\u00A0-\u00FF %!\"$&'()*,\-—.\/0-9:;=?\\@\^_`’~]+) *\| *(\1)([a-zа-яё]*) *\]\]/g, '[[$2]]$3') // "
r(/\[\[ *([^|\[\]]+)([^|\[\]]+) *\| *\1 *\]\]\2/g, '[[$1$2]]') // -повтор текста за ссылкой
r(/\[\[ *(?!Файл:|Категория:)([a-zA-Zа-яёА-ЯЁ\u00A0-\u00FF %!\"$&'()*,\-—.\/0-9:;=?\\@\^_`’~]+) *\| *([^|[\]]+) *\]\]([a-zа-яё]+)/g, '[[$1|$2$3]]') // "
hide(/\[\[[^\]|]+/g)//only link part


//TAGS
r(/<<(\S.+\S)>>/g, '"$1"') //<< >>
r(/(sup>|sub>|\s)-(\d)/g, '$1−$2') //minus
r(/&sup2;/gi, '²')
r(/&sup3;/gi, '³')
r(/<(b|strong)>(.*?)<\/(b|strong)>/gi,"'''$2'''")
r(/<(i|em)>(.*?)<\/(i|em)>/gi,"''$2''")
r(/^<hr ?\/?>/gim, '----')
r(/<\/?(hr|br)( [^\/>]+?)? ?\/?>/gi, '<$1$2 />')
r(/(\n== *[a-zа-я\s\.:]+ *==\n+)<references *\/>/ig,'$1{\{примечания}}')
hide(/<[a-z][^>]*?>/gi)

hide(/^({\||\|-).*/mg)//table/row def
hide(/(^\||^!|!!|\|\|) *[a-z]+=[^|]+\|(?!\|)/mgi)//cell style
hide(/\| +/g)//formatted cell

r(/[ \t]+/g,' ')//double spaces

// Headings
r(/^(=+)[ \t\f\v]*(.*?)[ \t\f\v]*=+$/gm, '$1 $2 $1') //add spaces inside
r(/([^\r\n])(\r?\n==.*==\r?\n)/g, '$1\n$2') //add empty line before
r(/^== см(\.?|отри|отрите) ?также ==$/gmi, '== См. также ==')
r(/^== сноски ==$/gmi, '== Примечания ==')
r(/^== внешние\sссылки ==$/gmi, '== Ссылки ==')
r(/^== (.+)[.:] ==$/gm, '== $1 ==')

r(/«|»|“|”|„/g, '"')//temp

// Hyphens and en dashes to pretty dashes
r(/–/g, '-') //&ndash; ->  hyphen
r(/&(#151|[nm]dash);/g, '—') // -> &mdash;
r(/(&nbsp;|\s)-{1,3} /g, '$1— ') // hyphen -> &mdash;
r(/(\d)--(\d)/g, '$1—$2') // -> &mdash;

// Entities etc. → Unicode chars
r(/&#x([0-9a-f]{1,4});/gi, function(n,a){return String.fromCharCode(eval('0x'+a.substr(-4)))})  //&#x301;
r(/&copy;/gi,'©')
r(/&reg;/gi,'®')
r(/&sect;/gi,'§')
r(/&euro;/gi,'€')
r(/&yen;/gi,'¥')
r(/&pound;/gi,'£')
r(/&deg;/g,'°')
r(/\(tm\)|&trade;/gi,'™')
r(/\.\.\.|&hellip;/g,'…')
r(/\+-(?!\+|-)|&plusmn;/g,'±')
r(/~=/g,'≈')
r(/\^2(\D)/g,'²$1')
r(/\^3(\D)/g,'³$1')
r(/&((la|ra|bd|ld)quo|quot);/g,'"')
r(/([\wа-яА-ЯёЁ])'([\wа-яА-ЯёЁ])/g,'$1’$2') //'
r(/№№/g,'№')

// Year and century ranges
r(/(\(|\s)([12]?\d{3})[\u00A0 ]?(-{1,3}|—) ?([12]?\d{3})(?![\w-])/g, '$1$2—$4')
r(/([12]?\d{3}) ?(гг?\.)/g, '$1'+u+'$2')
r(/(\(|\s)([IVX]{1,5})[\u00A0 ]?(-{1,3}|—) ?([IVX]{1,5})(?![\w-])/g, '$1$2—$4')
r(/([IVX]{1,5}) ?(вв?\.)/g, '$1'+u+'$2')

// Reductions
r(/(Т|т)\.\s?е\./g, '$1о есть')
r(/(Т|т)\.\s?к\./g, '$1ак как')
r(/(В|в)\sт\. ?ч\./g, '$1 том числе')
r(/(И|и)\sт\.\s?д\./g, '$1'+u+'т\.'+u+'д\.')
r(/(И|и)\sт\.\s?п\./g, '$1'+u+'т\.'+u+'п\.')
r(/(Т|т)\.\s?н\./g, '$1\.'+u+'н\.')
r(/(И|и)\.\s?о\./g, '$1\.'+u+'о\.')
r(/н\.\s?э\./g, 'н\.'+u+'э\.')
r(/(Д|д)(о|\.)\sн\.\s?э\./g, '$1о'+u+'н\.'+u+'э\.')
r(/(\d)[\u00A0 ]?(млн|млрд|трлн|(?:м|с|д|к)?м|[км]г)\.?(?=[,;.]| "?[а-яё-])/g, '$1'+u+'$2')
r(/(\d)[\u00A0 ](тыс)([^\.А-Яа-яЁё])/g, '$1'+u+'$2.$3')
r(/ISBN:\s?(?=[\d\-]{8,17})/,'ISBN ')

// Insert/delete spaces
r(/^([#*:]+)[ \t\f\v]*(?!\{\|)([^ \t\f\v*#:;])/gm, '$1 $2') //space after #*: unless before table
r(/(\S) (-{1,3}|—) (\S)/g, '$1'+u+'— $3')
r(/([А-Я]\.) ?([А-Я]\.) ?([А-Я][а-я])/g, '$1'+u+'$2'+u+'$3')
r(/([А-Я]\.)([А-Я]\.)/g, '$1 $2')
r(/([а-я]\.)([А-ЯA-Z])/g, '$1 $2') // word. word
r(/([)"а-яa-z\]])\s*,([\[("а-яa-z])/g, '$1, $2') // word, word
r(/([)"а-яa-z\]])\s([,;])\s([\[("а-яa-z])/g, '$1$2 $3')
r(/([^%\/\w]\d+?(?:[.,]\d+?)?) ?([%‰])(?!-[А-Яа-яЁё])/g, '$1'+u+'$2') //5 %
r(/(\d) ([%‰])(?=-[А-Яа-яЁё])/g, '$1$2') //5%-й
r(/([№§])(\s*)(\d)/g, '$1'+u+'$3')
r(/\( +/g, '('); r(/ +\)/g, ')') //inside ()

//Temperature
r(/([\s\d=≈≠≤≥<>—("'|])([+±−-]?\d+?(?:[.,]\d+?)?)(([ °^*]| [°^*])C)(?=[\s"').,;!?|])/gm, '$1$2'+u+'°C') //'
r(/([\s\d=≈≠≤≥<>—("'|])([+±−-]?\d+?(?:[.,]\d+?)?)(([ °^*]| [°^*])F)(?=[\s"').,;|!?])/gm, '$1$2'+u+'°F') //'

//Dot → comma in numbers
r(/(\s\d+)\.(\d+[\u00A0 ]*[%‰°])/gi, '$1,$2')

//"" → «»
for (var i=1; i<=2; i++)
 r(/([\s\x02!|#'"\/(;+-])"([^"]*)([^\s"(|])"([^a-zа-яё])/ig, '$1«$2$3»$4') //"
while (/«[^»]*«/.test(txt)) 
 r(/«([^»]*)«([^»]*)»/g, '«$1„$2“')

txt=txt.substr(1, txt.length-2)
if ('0'.replace('0','$$') == '$') ////$ in replacing string is special, except in IE
 for (var i=0; i<hidden.length; i++) hidden[i] = hidden[i].replace(/\$/g, '$$$$')
while (hidden.length>0) 
 r('\x01'+hidden.length+'\x02', hidden.pop())

}

function r(r1, r2){ txt = txt.replace(r1, r2) }
function hide(re){ r(re, function(s){return '\x01'+hidden.push(s)+'\x02'})}
function hideTag(tag){ hide(RegExp('<' + tag + '( [^>]+)?>[\\s\\S]+?<\\/' + tag + '>','gi')) }

}