xref: /aoo4110/main/sal/textenc/tcvtbyte.c (revision b1cdbd2c)
1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski #include "tenchelp.h"
25*b1cdbd2cSJim Jagielski #include "rtl/textcvt.h"
26*b1cdbd2cSJim Jagielski 
27*b1cdbd2cSJim Jagielski /* ======================================================================= */
28*b1cdbd2cSJim Jagielski 
29*b1cdbd2cSJim Jagielski #define IMPL_MAX_REPLACECHAR 5
30*b1cdbd2cSJim Jagielski 
31*b1cdbd2cSJim Jagielski sal_uInt16 ImplGetReplaceChar(sal_Unicode c);
32*b1cdbd2cSJim Jagielski 
33*b1cdbd2cSJim Jagielski sal_uInt16 const * ImplGetReplaceString(sal_Unicode c);
34*b1cdbd2cSJim Jagielski 
35*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
36*b1cdbd2cSJim Jagielski 
37*b1cdbd2cSJim Jagielski typedef struct
38*b1cdbd2cSJim Jagielski {
39*b1cdbd2cSJim Jagielski     sal_uInt16      mnUniChar;
40*b1cdbd2cSJim Jagielski     sal_uInt16      mnReplaceChar;
41*b1cdbd2cSJim Jagielski } ImplReplaceCharData;
42*b1cdbd2cSJim Jagielski 
43*b1cdbd2cSJim Jagielski static ImplReplaceCharData const aImplRepCharTab[] =
44*b1cdbd2cSJim Jagielski {
45*b1cdbd2cSJim Jagielski   { 0x00A0, 0x0020 },   /* NO-BREAK-SPACE */
46*b1cdbd2cSJim Jagielski   { 0x00A1, 0x0021 },   /* INVERTED EXCLAMATION MARK */
47*b1cdbd2cSJim Jagielski   { 0x00B7, 0x0045 },   /* MIDDLE DOT */
48*b1cdbd2cSJim Jagielski   { 0x00BF, 0x003F },   /* INVERTED QUESTION MARK */
49*b1cdbd2cSJim Jagielski   { 0x00D7, 0x002A },   /* MULTIPLIKATION SIGN */
50*b1cdbd2cSJim Jagielski   { 0x00F7, 0x002F },   /* DIVISION SIGN */
51*b1cdbd2cSJim Jagielski   { 0x2000, 0x0020 },   /* EN QUAD */
52*b1cdbd2cSJim Jagielski   { 0x2001, 0x0020 },   /* EM QUAD */
53*b1cdbd2cSJim Jagielski   { 0x2002, 0x0020 },   /* EN SPACE */
54*b1cdbd2cSJim Jagielski   { 0x2003, 0x0020 },   /* EM SPACE */
55*b1cdbd2cSJim Jagielski   { 0x2004, 0x0020 },   /* THREE-PER-EM SPACE */
56*b1cdbd2cSJim Jagielski   { 0x2005, 0x0020 },   /* FOUR-PER-EM SPACE */
57*b1cdbd2cSJim Jagielski   { 0x2006, 0x0020 },   /* SIX-PER-EM SPACE */
58*b1cdbd2cSJim Jagielski   { 0x2007, 0x0020 },   /* FIGURE SPACE */
59*b1cdbd2cSJim Jagielski   { 0x2008, 0x0020 },   /* PUNCTATION SPACE */
60*b1cdbd2cSJim Jagielski   { 0x2009, 0x0020 },   /* THIN SPACE */
61*b1cdbd2cSJim Jagielski   { 0x200A, 0x0020 },   /* HAIR SPACE */
62*b1cdbd2cSJim Jagielski   { 0x2010, 0x002D },   /* HYPHEN */
63*b1cdbd2cSJim Jagielski   { 0x2011, 0x002D },   /* NON-BREAKING HYPHEN */
64*b1cdbd2cSJim Jagielski   { 0x2012, 0x002D },   /* FIGURE DASH */
65*b1cdbd2cSJim Jagielski   { 0x2013, 0x002D },   /* EN DASH */
66*b1cdbd2cSJim Jagielski   { 0x2014, 0x002D },   /* EM DASH */
67*b1cdbd2cSJim Jagielski   { 0x2015, 0x002D },   /* HORIZONTAL BAR */
68*b1cdbd2cSJim Jagielski   { 0x2018, 0x0027 },   /* LEFT SINGLE QUOTATION MARK */
69*b1cdbd2cSJim Jagielski   { 0x2019, 0x0027 },   /* RIGHT SINGLE QUOTATION MARK */
70*b1cdbd2cSJim Jagielski   { 0x201A, 0x002C },   /* SINGLE LOW-9 QUOTATION MARK */
71*b1cdbd2cSJim Jagielski   { 0x201B, 0x0027 },   /* SINGLE HIGH-RESERVED-9 QUOTATION MARK */
72*b1cdbd2cSJim Jagielski   { 0x201C, 0x0022 },   /* LEFT DOUBLE QUOTATION MARK */
73*b1cdbd2cSJim Jagielski   { 0x201D, 0x0022 },   /* RIGHT DOUBLE QUOTATION MARK */
74*b1cdbd2cSJim Jagielski   { 0x201E, 0x0022 },   /* DOUBLE LOW-9 QUOTATION MARK */
75*b1cdbd2cSJim Jagielski   { 0x201F, 0x0022 },   /* DOUBLE HIGH-RESERVED-9 QUOTATION MARK */
76*b1cdbd2cSJim Jagielski   { 0x2022, 0x002D },   /* BULLET */
77*b1cdbd2cSJim Jagielski   { 0x2023, 0x002D },   /* TRIANGULAR BULLET */
78*b1cdbd2cSJim Jagielski   { 0x2024, 0x002D },   /* ONE DOT LEADER */
79*b1cdbd2cSJim Jagielski   { 0x2027, 0x002D },   /* HYPHENATION POINT */
80*b1cdbd2cSJim Jagielski   { 0x2028, 0x000A },   /* LINE SEPARATOR */
81*b1cdbd2cSJim Jagielski   { 0x2029, 0x000D },   /* PARAGRAPH SEPARATOR */
82*b1cdbd2cSJim Jagielski   { 0x2032, 0x0027 },   /* PRIME */
83*b1cdbd2cSJim Jagielski   { 0x2033, 0x0022 },   /* DOUBLE PRIME */
84*b1cdbd2cSJim Jagielski   { 0x2035, 0x0027 },   /* RESERVED PRIME */
85*b1cdbd2cSJim Jagielski   { 0x2036, 0x0022 },   /* RESERVED DOUBLE PRIME */
86*b1cdbd2cSJim Jagielski   { 0x2039, 0x003C },   /* SINGLE LEFT-POINTING ANGLE QUOTATION MARK */
87*b1cdbd2cSJim Jagielski   { 0x203A, 0x003E },   /* SINGLE RIGHT-POINTING ANGLE QUOTATION MARK */
88*b1cdbd2cSJim Jagielski   { 0x2043, 0x002D },   /* HYPHEN BULLET */
89*b1cdbd2cSJim Jagielski   { 0x2044, 0x002F },   /* FRACTION SLASH */
90*b1cdbd2cSJim Jagielski   { 0x2160, 0x0049 },   /* ROMAN NUMERAL ONE */
91*b1cdbd2cSJim Jagielski   { 0x2164, 0x0056 },   /* ROMAN NUMERAL FIVE */
92*b1cdbd2cSJim Jagielski   { 0x2169, 0x0058 },   /* ROMAN NUMERAL TEN */
93*b1cdbd2cSJim Jagielski   { 0x216C, 0x004C },   /* ROMAN NUMERAL FIFTY */
94*b1cdbd2cSJim Jagielski   { 0x216D, 0x0043 },   /* ROMAN NUMERAL ONE HUNDRED */
95*b1cdbd2cSJim Jagielski   { 0x216E, 0x0044 },   /* ROMAN NUMERAL FIVE HUNDRED */
96*b1cdbd2cSJim Jagielski   { 0x216F, 0x004D },   /* ROMAN NUMERAL ONE THOUSAND */
97*b1cdbd2cSJim Jagielski   { 0x2170, 0x0069 },   /* SMALL ROMAN NUMERAL ONE */
98*b1cdbd2cSJim Jagielski   { 0x2174, 0x0076 },   /* SMALL ROMAN NUMERAL FIVE */
99*b1cdbd2cSJim Jagielski   { 0x2179, 0x0078 },   /* SMALL ROMAN NUMERAL TEN */
100*b1cdbd2cSJim Jagielski   { 0x217C, 0x006C },   /* SMALL ROMAN NUMERAL FIFTY */
101*b1cdbd2cSJim Jagielski   { 0x217D, 0x0063 },   /* SMALL ROMAN NUMERAL ONE HUNDRED */
102*b1cdbd2cSJim Jagielski   { 0x217E, 0x0064 },   /* SMALL ROMAN NUMERAL FIVE HUNDRED */
103*b1cdbd2cSJim Jagielski   { 0x217F, 0x006D },   /* SMALL ROMAN NUMERAL ONE THOUSAND */
104*b1cdbd2cSJim Jagielski   { 0x2215, 0x002F },   /* DIVISION SLASH */
105*b1cdbd2cSJim Jagielski   { 0x2217, 0x002A },   /* ASTERIX OPERATOR */
106*b1cdbd2cSJim Jagielski   { 0xFF00, 0x0020 },   /* FULLWIDTH ASCII FORMS */
107*b1cdbd2cSJim Jagielski   { 0xFF01, 0x0021 },   /* FULLWIDTH ASCII FORMS */
108*b1cdbd2cSJim Jagielski   { 0xFF02, 0x0022 },   /* FULLWIDTH ASCII FORMS*/
109*b1cdbd2cSJim Jagielski   { 0xFF03, 0x0023 },   /* FULLWIDTH ASCII FORMS */
110*b1cdbd2cSJim Jagielski   { 0xFF04, 0x0024 },   /* FULLWIDTH ASCII FORMS*/
111*b1cdbd2cSJim Jagielski   { 0xFF05, 0x0025 },   /* FULLWIDTH ASCII FORMS */
112*b1cdbd2cSJim Jagielski   { 0xFF06, 0x0026 },   /* FULLWIDTH ASCII FORMS*/
113*b1cdbd2cSJim Jagielski   { 0xFF07, 0x0027 },   /* FULLWIDTH ASCII FORMS */
114*b1cdbd2cSJim Jagielski   { 0xFF08, 0x0028 },   /* FULLWIDTH ASCII FORMS*/
115*b1cdbd2cSJim Jagielski   { 0xFF09, 0x0029 },   /* FULLWIDTH ASCII FORMS */
116*b1cdbd2cSJim Jagielski   { 0xFF0A, 0x002A },   /* FULLWIDTH ASCII FORMS*/
117*b1cdbd2cSJim Jagielski   { 0xFF0B, 0x002B },   /* FULLWIDTH ASCII FORMS */
118*b1cdbd2cSJim Jagielski   { 0xFF0C, 0x002C },   /* FULLWIDTH ASCII FORMS*/
119*b1cdbd2cSJim Jagielski   { 0xFF0D, 0x002D },   /* FULLWIDTH ASCII FORMS */
120*b1cdbd2cSJim Jagielski   { 0xFF0E, 0x002E },   /* FULLWIDTH ASCII FORMS*/
121*b1cdbd2cSJim Jagielski   { 0xFF0F, 0x002F },   /* FULLWIDTH ASCII FORMS */
122*b1cdbd2cSJim Jagielski   { 0xFF10, 0x0030 },   /* FULLWIDTH ASCII FORMS */
123*b1cdbd2cSJim Jagielski   { 0xFF11, 0x0031 },   /* FULLWIDTH ASCII FORMS */
124*b1cdbd2cSJim Jagielski   { 0xFF12, 0x0032 },   /* FULLWIDTH ASCII FORMS*/
125*b1cdbd2cSJim Jagielski   { 0xFF13, 0x0033 },   /* FULLWIDTH ASCII FORMS */
126*b1cdbd2cSJim Jagielski   { 0xFF14, 0x0034 },   /* FULLWIDTH ASCII FORMS*/
127*b1cdbd2cSJim Jagielski   { 0xFF15, 0x0035 },   /* FULLWIDTH ASCII FORMS */
128*b1cdbd2cSJim Jagielski   { 0xFF16, 0x0036 },   /* FULLWIDTH ASCII FORMS*/
129*b1cdbd2cSJim Jagielski   { 0xFF17, 0x0037 },   /* FULLWIDTH ASCII FORMS */
130*b1cdbd2cSJim Jagielski   { 0xFF18, 0x0038 },   /* FULLWIDTH ASCII FORMS*/
131*b1cdbd2cSJim Jagielski   { 0xFF19, 0x0039 },   /* FULLWIDTH ASCII FORMS */
132*b1cdbd2cSJim Jagielski   { 0xFF1A, 0x003A },   /* FULLWIDTH ASCII FORMS*/
133*b1cdbd2cSJim Jagielski   { 0xFF1B, 0x003B },   /* FULLWIDTH ASCII FORMS */
134*b1cdbd2cSJim Jagielski   { 0xFF1C, 0x003C },   /* FULLWIDTH ASCII FORMS*/
135*b1cdbd2cSJim Jagielski   { 0xFF1D, 0x003D },   /* FULLWIDTH ASCII FORMS */
136*b1cdbd2cSJim Jagielski   { 0xFF1E, 0x003E },   /* FULLWIDTH ASCII FORMS*/
137*b1cdbd2cSJim Jagielski   { 0xFF1F, 0x003F },   /* FULLWIDTH ASCII FORMS */
138*b1cdbd2cSJim Jagielski   { 0xFF20, 0x0040 },   /* FULLWIDTH ASCII FORMS */
139*b1cdbd2cSJim Jagielski   { 0xFF21, 0x0041 },   /* FULLWIDTH ASCII FORMS */
140*b1cdbd2cSJim Jagielski   { 0xFF22, 0x0042 },   /* FULLWIDTH ASCII FORMS*/
141*b1cdbd2cSJim Jagielski   { 0xFF23, 0x0043 },   /* FULLWIDTH ASCII FORMS */
142*b1cdbd2cSJim Jagielski   { 0xFF24, 0x0044 },   /* FULLWIDTH ASCII FORMS*/
143*b1cdbd2cSJim Jagielski   { 0xFF25, 0x0045 },   /* FULLWIDTH ASCII FORMS */
144*b1cdbd2cSJim Jagielski   { 0xFF26, 0x0046 },   /* FULLWIDTH ASCII FORMS*/
145*b1cdbd2cSJim Jagielski   { 0xFF27, 0x0047 },   /* FULLWIDTH ASCII FORMS */
146*b1cdbd2cSJim Jagielski   { 0xFF28, 0x0048 },   /* FULLWIDTH ASCII FORMS*/
147*b1cdbd2cSJim Jagielski   { 0xFF29, 0x0049 },   /* FULLWIDTH ASCII FORMS */
148*b1cdbd2cSJim Jagielski   { 0xFF2A, 0x004A },   /* FULLWIDTH ASCII FORMS*/
149*b1cdbd2cSJim Jagielski   { 0xFF2B, 0x004B },   /* FULLWIDTH ASCII FORMS */
150*b1cdbd2cSJim Jagielski   { 0xFF2C, 0x004C },   /* FULLWIDTH ASCII FORMS*/
151*b1cdbd2cSJim Jagielski   { 0xFF2D, 0x004D },   /* FULLWIDTH ASCII FORMS */
152*b1cdbd2cSJim Jagielski   { 0xFF2E, 0x004E },   /* FULLWIDTH ASCII FORMS*/
153*b1cdbd2cSJim Jagielski   { 0xFF2F, 0x004F },   /* FULLWIDTH ASCII FORMS */
154*b1cdbd2cSJim Jagielski   { 0xFF30, 0x0050 },   /* FULLWIDTH ASCII FORMS */
155*b1cdbd2cSJim Jagielski   { 0xFF31, 0x0051 },   /* FULLWIDTH ASCII FORMS */
156*b1cdbd2cSJim Jagielski   { 0xFF32, 0x0052 },   /* FULLWIDTH ASCII FORMS*/
157*b1cdbd2cSJim Jagielski   { 0xFF33, 0x0053 },   /* FULLWIDTH ASCII FORMS */
158*b1cdbd2cSJim Jagielski   { 0xFF34, 0x0054 },   /* FULLWIDTH ASCII FORMS*/
159*b1cdbd2cSJim Jagielski   { 0xFF35, 0x0055 },   /* FULLWIDTH ASCII FORMS */
160*b1cdbd2cSJim Jagielski   { 0xFF36, 0x0056 },   /* FULLWIDTH ASCII FORMS*/
161*b1cdbd2cSJim Jagielski   { 0xFF37, 0x0057 },   /* FULLWIDTH ASCII FORMS */
162*b1cdbd2cSJim Jagielski   { 0xFF38, 0x0058 },   /* FULLWIDTH ASCII FORMS*/
163*b1cdbd2cSJim Jagielski   { 0xFF39, 0x0059 },   /* FULLWIDTH ASCII FORMS */
164*b1cdbd2cSJim Jagielski   { 0xFF3A, 0x005A },   /* FULLWIDTH ASCII FORMS*/
165*b1cdbd2cSJim Jagielski   { 0xFF3B, 0x005B },   /* FULLWIDTH ASCII FORMS */
166*b1cdbd2cSJim Jagielski   { 0xFF3C, 0x005C },   /* FULLWIDTH ASCII FORMS*/
167*b1cdbd2cSJim Jagielski   { 0xFF3D, 0x005D },   /* FULLWIDTH ASCII FORMS */
168*b1cdbd2cSJim Jagielski   { 0xFF3E, 0x005E },   /* FULLWIDTH ASCII FORMS*/
169*b1cdbd2cSJim Jagielski   { 0xFF3F, 0x005F },   /* FULLWIDTH ASCII FORMS */
170*b1cdbd2cSJim Jagielski   { 0xFF40, 0x0060 },   /* FULLWIDTH ASCII FORMS */
171*b1cdbd2cSJim Jagielski   { 0xFF41, 0x0061 },   /* FULLWIDTH ASCII FORMS */
172*b1cdbd2cSJim Jagielski   { 0xFF42, 0x0062 },   /* FULLWIDTH ASCII FORMS*/
173*b1cdbd2cSJim Jagielski   { 0xFF43, 0x0063 },   /* FULLWIDTH ASCII FORMS */
174*b1cdbd2cSJim Jagielski   { 0xFF44, 0x0064 },   /* FULLWIDTH ASCII FORMS*/
175*b1cdbd2cSJim Jagielski   { 0xFF45, 0x0065 },   /* FULLWIDTH ASCII FORMS */
176*b1cdbd2cSJim Jagielski   { 0xFF46, 0x0066 },   /* FULLWIDTH ASCII FORMS*/
177*b1cdbd2cSJim Jagielski   { 0xFF47, 0x0067 },   /* FULLWIDTH ASCII FORMS */
178*b1cdbd2cSJim Jagielski   { 0xFF48, 0x0068 },   /* FULLWIDTH ASCII FORMS*/
179*b1cdbd2cSJim Jagielski   { 0xFF49, 0x0069 },   /* FULLWIDTH ASCII FORMS */
180*b1cdbd2cSJim Jagielski   { 0xFF4A, 0x006A },   /* FULLWIDTH ASCII FORMS*/
181*b1cdbd2cSJim Jagielski   { 0xFF4B, 0x006B },   /* FULLWIDTH ASCII FORMS */
182*b1cdbd2cSJim Jagielski   { 0xFF4C, 0x006C },   /* FULLWIDTH ASCII FORMS*/
183*b1cdbd2cSJim Jagielski   { 0xFF4D, 0x006D },   /* FULLWIDTH ASCII FORMS */
184*b1cdbd2cSJim Jagielski   { 0xFF4E, 0x006E },   /* FULLWIDTH ASCII FORMS*/
185*b1cdbd2cSJim Jagielski   { 0xFF4F, 0x006F },   /* FULLWIDTH ASCII FORMS */
186*b1cdbd2cSJim Jagielski   { 0xFF50, 0x0070 },   /* FULLWIDTH ASCII FORMS */
187*b1cdbd2cSJim Jagielski   { 0xFF51, 0x0071 },   /* FULLWIDTH ASCII FORMS */
188*b1cdbd2cSJim Jagielski   { 0xFF52, 0x0072 },   /* FULLWIDTH ASCII FORMS*/
189*b1cdbd2cSJim Jagielski   { 0xFF53, 0x0073 },   /* FULLWIDTH ASCII FORMS */
190*b1cdbd2cSJim Jagielski   { 0xFF54, 0x0074 },   /* FULLWIDTH ASCII FORMS*/
191*b1cdbd2cSJim Jagielski   { 0xFF55, 0x0075 },   /* FULLWIDTH ASCII FORMS */
192*b1cdbd2cSJim Jagielski   { 0xFF56, 0x0076 },   /* FULLWIDTH ASCII FORMS*/
193*b1cdbd2cSJim Jagielski   { 0xFF57, 0x0077 },   /* FULLWIDTH ASCII FORMS */
194*b1cdbd2cSJim Jagielski   { 0xFF58, 0x0078 },   /* FULLWIDTH ASCII FORMS*/
195*b1cdbd2cSJim Jagielski   { 0xFF59, 0x0079 },   /* FULLWIDTH ASCII FORMS */
196*b1cdbd2cSJim Jagielski   { 0xFF5A, 0x007A },   /* FULLWIDTH ASCII FORMS*/
197*b1cdbd2cSJim Jagielski   { 0xFF5B, 0x007B },   /* FULLWIDTH ASCII FORMS */
198*b1cdbd2cSJim Jagielski   { 0xFF5C, 0x007C },   /* FULLWIDTH ASCII FORMS*/
199*b1cdbd2cSJim Jagielski   { 0xFF5D, 0x007D },   /* FULLWIDTH ASCII FORMS */
200*b1cdbd2cSJim Jagielski   { 0xFF5E, 0x007E },   /* FULLWIDTH ASCII FORMS*/
201*b1cdbd2cSJim Jagielski   { 0xFF5F, 0x007F },   /* FULLWIDTH ASCII FORMS */
202*b1cdbd2cSJim Jagielski   { 0xFF61, 0x3002 },   /* HALFWIDTH KATAKANA FORMS */
203*b1cdbd2cSJim Jagielski   { 0xFF62, 0x300C },   /* HALFWIDTH KATAKANA FORMS */
204*b1cdbd2cSJim Jagielski   { 0xFF63, 0x300D },   /* HALFWIDTH KATAKANA FORMS */
205*b1cdbd2cSJim Jagielski   { 0xFF64, 0x3001 },   /* HALFWIDTH KATAKANA FORMS */
206*b1cdbd2cSJim Jagielski   { 0xFF65, 0x30FB },   /* HALFWIDTH KATAKANA FORMS */
207*b1cdbd2cSJim Jagielski   { 0xFF66, 0x30F2 },   /* HALFWIDTH KATAKANA FORMS */
208*b1cdbd2cSJim Jagielski   { 0xFF67, 0x30A1 },   /* HALFWIDTH KATAKANA FORMS */
209*b1cdbd2cSJim Jagielski   { 0xFF68, 0x30A3 },   /* HALFWIDTH KATAKANA FORMS */
210*b1cdbd2cSJim Jagielski   { 0xFF69, 0x30A5 },   /* HALFWIDTH KATAKANA FORMS */
211*b1cdbd2cSJim Jagielski   { 0xFF6A, 0x30A7 },   /* HALFWIDTH KATAKANA FORMS */
212*b1cdbd2cSJim Jagielski   { 0xFF6B, 0x30A9 },   /* HALFWIDTH KATAKANA FORMS */
213*b1cdbd2cSJim Jagielski   { 0xFF6C, 0x30E3 },   /* HALFWIDTH KATAKANA FORMS */
214*b1cdbd2cSJim Jagielski   { 0xFF6D, 0x30E5 },   /* HALFWIDTH KATAKANA FORMS */
215*b1cdbd2cSJim Jagielski   { 0xFF6E, 0x30E7 },   /* HALFWIDTH KATAKANA FORMS */
216*b1cdbd2cSJim Jagielski   { 0xFF6F, 0x30C3 },   /* HALFWIDTH KATAKANA FORMS */
217*b1cdbd2cSJim Jagielski   { 0xFF70, 0x30FC },   /* HALFWIDTH KATAKANA FORMS */
218*b1cdbd2cSJim Jagielski   { 0xFF71, 0x30A2 },   /* HALFWIDTH KATAKANA FORMS */
219*b1cdbd2cSJim Jagielski   { 0xFF72, 0x30A4 },   /* HALFWIDTH KATAKANA FORMS */
220*b1cdbd2cSJim Jagielski   { 0xFF73, 0x30A6 },   /* HALFWIDTH KATAKANA FORMS */
221*b1cdbd2cSJim Jagielski   { 0xFF74, 0x30A8 },   /* HALFWIDTH KATAKANA FORMS */
222*b1cdbd2cSJim Jagielski   { 0xFF75, 0x30AA },   /* HALFWIDTH KATAKANA FORMS */
223*b1cdbd2cSJim Jagielski   { 0xFF76, 0x30AB },   /* HALFWIDTH KATAKANA FORMS */
224*b1cdbd2cSJim Jagielski   { 0xFF77, 0x30AD },   /* HALFWIDTH KATAKANA FORMS */
225*b1cdbd2cSJim Jagielski   { 0xFF78, 0x30AF },   /* HALFWIDTH KATAKANA FORMS */
226*b1cdbd2cSJim Jagielski   { 0xFF79, 0x30B1 },   /* HALFWIDTH KATAKANA FORMS */
227*b1cdbd2cSJim Jagielski   { 0xFF7A, 0x30B3 },   /* HALFWIDTH KATAKANA FORMS */
228*b1cdbd2cSJim Jagielski   { 0xFF7B, 0x30B5 },   /* HALFWIDTH KATAKANA FORMS */
229*b1cdbd2cSJim Jagielski   { 0xFF7C, 0x30B7 },   /* HALFWIDTH KATAKANA FORMS */
230*b1cdbd2cSJim Jagielski   { 0xFF7D, 0x30B9 },   /* HALFWIDTH KATAKANA FORMS */
231*b1cdbd2cSJim Jagielski   { 0xFF7E, 0x30BB },   /* HALFWIDTH KATAKANA FORMS */
232*b1cdbd2cSJim Jagielski   { 0xFF7F, 0x30BD },   /* HALFWIDTH KATAKANA FORMS */
233*b1cdbd2cSJim Jagielski   { 0xFF80, 0x30BF },   /* HALFWIDTH KATAKANA FORMS */
234*b1cdbd2cSJim Jagielski   { 0xFF81, 0x30C1 },   /* HALFWIDTH KATAKANA FORMS */
235*b1cdbd2cSJim Jagielski   { 0xFF82, 0x30C4 },   /* HALFWIDTH KATAKANA FORMS */
236*b1cdbd2cSJim Jagielski   { 0xFF83, 0x30C6 },   /* HALFWIDTH KATAKANA FORMS */
237*b1cdbd2cSJim Jagielski   { 0xFF84, 0x30C8 },   /* HALFWIDTH KATAKANA FORMS */
238*b1cdbd2cSJim Jagielski   { 0xFF85, 0x30CA },   /* HALFWIDTH KATAKANA FORMS */
239*b1cdbd2cSJim Jagielski   { 0xFF86, 0x30CB },   /* HALFWIDTH KATAKANA FORMS */
240*b1cdbd2cSJim Jagielski   { 0xFF87, 0x30CC },   /* HALFWIDTH KATAKANA FORMS */
241*b1cdbd2cSJim Jagielski   { 0xFF88, 0x30CD },   /* HALFWIDTH KATAKANA FORMS */
242*b1cdbd2cSJim Jagielski   { 0xFF89, 0x30CE },   /* HALFWIDTH KATAKANA FORMS */
243*b1cdbd2cSJim Jagielski   { 0xFF8A, 0x30CF },   /* HALFWIDTH KATAKANA FORMS */
244*b1cdbd2cSJim Jagielski   { 0xFF8B, 0x30D2 },   /* HALFWIDTH KATAKANA FORMS */
245*b1cdbd2cSJim Jagielski   { 0xFF8C, 0x30D5 },   /* HALFWIDTH KATAKANA FORMS */
246*b1cdbd2cSJim Jagielski   { 0xFF8D, 0x30D8 },   /* HALFWIDTH KATAKANA FORMS */
247*b1cdbd2cSJim Jagielski   { 0xFF8E, 0x30DB },   /* HALFWIDTH KATAKANA FORMS */
248*b1cdbd2cSJim Jagielski   { 0xFF8F, 0x30DE },   /* HALFWIDTH KATAKANA FORMS */
249*b1cdbd2cSJim Jagielski   { 0xFF90, 0x30DF },   /* HALFWIDTH KATAKANA FORMS */
250*b1cdbd2cSJim Jagielski   { 0xFF91, 0x30E0 },   /* HALFWIDTH KATAKANA FORMS */
251*b1cdbd2cSJim Jagielski   { 0xFF92, 0x30E1 },   /* HALFWIDTH KATAKANA FORMS */
252*b1cdbd2cSJim Jagielski   { 0xFF93, 0x30E2 },   /* HALFWIDTH KATAKANA FORMS */
253*b1cdbd2cSJim Jagielski   { 0xFF94, 0x30E4 },   /* HALFWIDTH KATAKANA FORMS */
254*b1cdbd2cSJim Jagielski   { 0xFF95, 0x30E6 },   /* HALFWIDTH KATAKANA FORMS */
255*b1cdbd2cSJim Jagielski   { 0xFF96, 0x30E8 },   /* HALFWIDTH KATAKANA FORMS */
256*b1cdbd2cSJim Jagielski   { 0xFF97, 0x30E9 },   /* HALFWIDTH KATAKANA FORMS */
257*b1cdbd2cSJim Jagielski   { 0xFF98, 0x30EA },   /* HALFWIDTH KATAKANA FORMS */
258*b1cdbd2cSJim Jagielski   { 0xFF99, 0x30EB },   /* HALFWIDTH KATAKANA FORMS */
259*b1cdbd2cSJim Jagielski   { 0xFF9A, 0x30EC },   /* HALFWIDTH KATAKANA FORMS */
260*b1cdbd2cSJim Jagielski   { 0xFF9B, 0x30ED },   /* HALFWIDTH KATAKANA FORMS */
261*b1cdbd2cSJim Jagielski   { 0xFF9C, 0x30EF },   /* HALFWIDTH KATAKANA FORMS */
262*b1cdbd2cSJim Jagielski   { 0xFF9D, 0x30F3 },   /* HALFWIDTH KATAKANA FORMS */
263*b1cdbd2cSJim Jagielski   { 0xFF9E, 0x309B },   /* HALFWIDTH KATAKANA FORMS */
264*b1cdbd2cSJim Jagielski   { 0xFF9F, 0x309C },   /* HALFWIDTH KATAKANA FORMS */
265*b1cdbd2cSJim Jagielski   { 0xFFA0, 0x3164 },   /* HALFWIDTH HANGUL FORMS */
266*b1cdbd2cSJim Jagielski   { 0xFFA1, 0x3131 },   /* HALFWIDTH HANGUL FORMS */
267*b1cdbd2cSJim Jagielski   { 0xFFA2, 0x3132 },   /* HALFWIDTH HANGUL FORMS */
268*b1cdbd2cSJim Jagielski   { 0xFFA3, 0x3133 },   /* HALFWIDTH HANGUL FORMS */
269*b1cdbd2cSJim Jagielski   { 0xFFA4, 0x3134 },   /* HALFWIDTH HANGUL FORMS */
270*b1cdbd2cSJim Jagielski   { 0xFFA5, 0x3135 },   /* HALFWIDTH HANGUL FORMS */
271*b1cdbd2cSJim Jagielski   { 0xFFA6, 0x3136 },   /* HALFWIDTH HANGUL FORMS */
272*b1cdbd2cSJim Jagielski   { 0xFFA7, 0x3137 },   /* HALFWIDTH HANGUL FORMS */
273*b1cdbd2cSJim Jagielski   { 0xFFA8, 0x3138 },   /* HALFWIDTH HANGUL FORMS */
274*b1cdbd2cSJim Jagielski   { 0xFFA9, 0x3139 },   /* HALFWIDTH HANGUL FORMS */
275*b1cdbd2cSJim Jagielski   { 0xFFAA, 0x313A },   /* HALFWIDTH HANGUL FORMS */
276*b1cdbd2cSJim Jagielski   { 0xFFAB, 0x313B },   /* HALFWIDTH HANGUL FORMS */
277*b1cdbd2cSJim Jagielski   { 0xFFAC, 0x313C },   /* HALFWIDTH HANGUL FORMS */
278*b1cdbd2cSJim Jagielski   { 0xFFAD, 0x313D },   /* HALFWIDTH HANGUL FORMS */
279*b1cdbd2cSJim Jagielski   { 0xFFAE, 0x313E },   /* HALFWIDTH HANGUL FORMS */
280*b1cdbd2cSJim Jagielski   { 0xFFAF, 0x313F },   /* HALFWIDTH HANGUL FORMS */
281*b1cdbd2cSJim Jagielski   { 0xFFB0, 0x3140 },   /* HALFWIDTH HANGUL FORMS */
282*b1cdbd2cSJim Jagielski   { 0xFFB1, 0x3141 },   /* HALFWIDTH HANGUL FORMS */
283*b1cdbd2cSJim Jagielski   { 0xFFB2, 0x3142 },   /* HALFWIDTH HANGUL FORMS */
284*b1cdbd2cSJim Jagielski   { 0xFFB3, 0x3143 },   /* HALFWIDTH HANGUL FORMS */
285*b1cdbd2cSJim Jagielski   { 0xFFB4, 0x3144 },   /* HALFWIDTH HANGUL FORMS */
286*b1cdbd2cSJim Jagielski   { 0xFFB5, 0x3145 },   /* HALFWIDTH HANGUL FORMS */
287*b1cdbd2cSJim Jagielski   { 0xFFB6, 0x3146 },   /* HALFWIDTH HANGUL FORMS */
288*b1cdbd2cSJim Jagielski   { 0xFFB7, 0x3147 },   /* HALFWIDTH HANGUL FORMS */
289*b1cdbd2cSJim Jagielski   { 0xFFB8, 0x3148 },   /* HALFWIDTH HANGUL FORMS */
290*b1cdbd2cSJim Jagielski   { 0xFFB9, 0x3149 },   /* HALFWIDTH HANGUL FORMS */
291*b1cdbd2cSJim Jagielski   { 0xFFBA, 0x314A },   /* HALFWIDTH HANGUL FORMS */
292*b1cdbd2cSJim Jagielski   { 0xFFBB, 0x314B },   /* HALFWIDTH HANGUL FORMS */
293*b1cdbd2cSJim Jagielski   { 0xFFBC, 0x314C },   /* HALFWIDTH HANGUL FORMS */
294*b1cdbd2cSJim Jagielski   { 0xFFBD, 0x314D },   /* HALFWIDTH HANGUL FORMS */
295*b1cdbd2cSJim Jagielski   { 0xFFBE, 0x314E },   /* HALFWIDTH HANGUL FORMS */
296*b1cdbd2cSJim Jagielski   { 0xFFC2, 0x314F },   /* HALFWIDTH HANGUL FORMS */
297*b1cdbd2cSJim Jagielski   { 0xFFC3, 0x3150 },   /* HALFWIDTH HANGUL FORMS */
298*b1cdbd2cSJim Jagielski   { 0xFFC4, 0x3151 },   /* HALFWIDTH HANGUL FORMS */
299*b1cdbd2cSJim Jagielski   { 0xFFC5, 0x3152 },   /* HALFWIDTH HANGUL FORMS */
300*b1cdbd2cSJim Jagielski   { 0xFFC6, 0x3153 },   /* HALFWIDTH HANGUL FORMS */
301*b1cdbd2cSJim Jagielski   { 0xFFC7, 0x3154 },   /* HALFWIDTH HANGUL FORMS */
302*b1cdbd2cSJim Jagielski   { 0xFFCA, 0x3155 },   /* HALFWIDTH HANGUL FORMS */
303*b1cdbd2cSJim Jagielski   { 0xFFCB, 0x3156 },   /* HALFWIDTH HANGUL FORMS */
304*b1cdbd2cSJim Jagielski   { 0xFFCC, 0x3157 },   /* HALFWIDTH HANGUL FORMS */
305*b1cdbd2cSJim Jagielski   { 0xFFCD, 0x3158 },   /* HALFWIDTH HANGUL FORMS */
306*b1cdbd2cSJim Jagielski   { 0xFFCE, 0x3159 },   /* HALFWIDTH HANGUL FORMS */
307*b1cdbd2cSJim Jagielski   { 0xFFCF, 0x315A },   /* HALFWIDTH HANGUL FORMS */
308*b1cdbd2cSJim Jagielski   { 0xFFD2, 0x315B },   /* HALFWIDTH HANGUL FORMS */
309*b1cdbd2cSJim Jagielski   { 0xFFD3, 0x315C },   /* HALFWIDTH HANGUL FORMS */
310*b1cdbd2cSJim Jagielski   { 0xFFD4, 0x315D },   /* HALFWIDTH HANGUL FORMS */
311*b1cdbd2cSJim Jagielski   { 0xFFD5, 0x315E },   /* HALFWIDTH HANGUL FORMS */
312*b1cdbd2cSJim Jagielski   { 0xFFD6, 0x315F },   /* HALFWIDTH HANGUL FORMS */
313*b1cdbd2cSJim Jagielski   { 0xFFD7, 0x3160 },   /* HALFWIDTH HANGUL FORMS */
314*b1cdbd2cSJim Jagielski   { 0xFFDA, 0x3161 },   /* HALFWIDTH HANGUL FORMS */
315*b1cdbd2cSJim Jagielski   { 0xFFDB, 0x3162 },   /* HALFWIDTH HANGUL FORMS */
316*b1cdbd2cSJim Jagielski   { 0xFFDC, 0x3163 },   /* HALFWIDTH HANGUL FORMS */
317*b1cdbd2cSJim Jagielski   { 0xFFE0, 0x00A2 },   /* FULLWIDTH CENT SIGN */
318*b1cdbd2cSJim Jagielski   { 0xFFE1, 0x00A3 },   /* FULLWIDTH POUND SIGN */
319*b1cdbd2cSJim Jagielski   { 0xFFE2, 0x00AC },   /* FULLWIDTH NOT SIGN */
320*b1cdbd2cSJim Jagielski   { 0xFFE3, 0x00AF },   /* FULLWIDTH MACRON */
321*b1cdbd2cSJim Jagielski   { 0xFFE4, 0x00A6 },   /* FULLWIDTH BROKEN BAR */
322*b1cdbd2cSJim Jagielski   { 0xFFE5, 0x00A5 },   /* FULLWIDTH YEN SIGN */
323*b1cdbd2cSJim Jagielski   { 0xFFE6, 0x20A9 },   /* FULLWIDTH WON SIGN */
324*b1cdbd2cSJim Jagielski   { 0xFFE8, 0x2502 },   /* HALFWIDTH FORMS LIGHT VERTICAL */
325*b1cdbd2cSJim Jagielski   { 0xFFE9, 0x2190 },   /* HALFWIDTH LEFTWARDS ARROW */
326*b1cdbd2cSJim Jagielski   { 0xFFEA, 0x2191 },   /* HALFWIDTH UPWARDS ARROW */
327*b1cdbd2cSJim Jagielski   { 0xFFEB, 0x2192 },   /* HALFWIDTH RIGHTWARDS ARROW */
328*b1cdbd2cSJim Jagielski   { 0xFFEC, 0x2193 },   /* HALFWIDTH DOWNWARDS ARROW */
329*b1cdbd2cSJim Jagielski   { 0xFFED, 0x25A0 },   /* HALFWIDTH BLACK SQUARE */
330*b1cdbd2cSJim Jagielski   { 0xFFEE, 0x25CB },   /* HALFWIDTH WHITE CIRCLE */
331*b1cdbd2cSJim Jagielski   { 0xFFFD, 0x003F }    /* REPLACEMENT CHARACTER */
332*b1cdbd2cSJim Jagielski };
333*b1cdbd2cSJim Jagielski 
ImplGetReplaceChar(sal_Unicode c)334*b1cdbd2cSJim Jagielski sal_uInt16 ImplGetReplaceChar( sal_Unicode c )
335*b1cdbd2cSJim Jagielski {
336*b1cdbd2cSJim Jagielski     sal_uInt16                  nLow;
337*b1cdbd2cSJim Jagielski     sal_uInt16                  nHigh;
338*b1cdbd2cSJim Jagielski     sal_uInt16                  nMid;
339*b1cdbd2cSJim Jagielski     sal_uInt16                  nCompareChar;
340*b1cdbd2cSJim Jagielski     const ImplReplaceCharData*  pCharData;
341*b1cdbd2cSJim Jagielski 
342*b1cdbd2cSJim Jagielski     nLow = 0;
343*b1cdbd2cSJim Jagielski     nHigh = (sizeof( aImplRepCharTab )/sizeof( ImplReplaceCharData ))-1;
344*b1cdbd2cSJim Jagielski     do
345*b1cdbd2cSJim Jagielski     {
346*b1cdbd2cSJim Jagielski         nMid = (nLow+nHigh)/2;
347*b1cdbd2cSJim Jagielski         pCharData = aImplRepCharTab+nMid;
348*b1cdbd2cSJim Jagielski         nCompareChar = pCharData->mnUniChar;
349*b1cdbd2cSJim Jagielski         if ( c < nCompareChar )
350*b1cdbd2cSJim Jagielski         {
351*b1cdbd2cSJim Jagielski             if ( !nMid )
352*b1cdbd2cSJim Jagielski                 break;
353*b1cdbd2cSJim Jagielski             nHigh = nMid-1;
354*b1cdbd2cSJim Jagielski         }
355*b1cdbd2cSJim Jagielski         else
356*b1cdbd2cSJim Jagielski         {
357*b1cdbd2cSJim Jagielski             if ( c > nCompareChar )
358*b1cdbd2cSJim Jagielski                 nLow = nMid+1;
359*b1cdbd2cSJim Jagielski             else
360*b1cdbd2cSJim Jagielski                 return pCharData->mnReplaceChar;
361*b1cdbd2cSJim Jagielski         }
362*b1cdbd2cSJim Jagielski     }
363*b1cdbd2cSJim Jagielski     while ( nLow <= nHigh );
364*b1cdbd2cSJim Jagielski 
365*b1cdbd2cSJim Jagielski     return 0;
366*b1cdbd2cSJim Jagielski }
367*b1cdbd2cSJim Jagielski 
368*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
369*b1cdbd2cSJim Jagielski 
370*b1cdbd2cSJim Jagielski typedef struct
371*b1cdbd2cSJim Jagielski {
372*b1cdbd2cSJim Jagielski     sal_uInt16      mnUniChar;
373*b1cdbd2cSJim Jagielski     sal_uInt16      maReplaceChars[IMPL_MAX_REPLACECHAR];
374*b1cdbd2cSJim Jagielski } ImplReplaceCharStrData;
375*b1cdbd2cSJim Jagielski 
376*b1cdbd2cSJim Jagielski static ImplReplaceCharStrData const aImplRepCharStrTab[] =
377*b1cdbd2cSJim Jagielski {
378*b1cdbd2cSJim Jagielski   { 0x00A9, { 0x0028, 0x0063, 0x0029, 0x0000, 0x0000  } },  /* COPYRIGHT SIGN */
379*b1cdbd2cSJim Jagielski   { 0x00AB, { 0x003C, 0x003C, 0x0000, 0x0000, 0x0000  } },  /* LEFT-POINTING-DOUBLE ANGLE QUOTATION MARK */
380*b1cdbd2cSJim Jagielski   { 0x0AE0, { 0x0028, 0x0072, 0x0029, 0x0000, 0x0000  } },  /* REGISTERED SIGN */
381*b1cdbd2cSJim Jagielski   { 0x00BB, { 0x003E, 0x003E, 0x0000, 0x0000, 0x0000  } },  /* RIGHT-POINTING-DOUBLE ANGLE QUOTATION MARK */
382*b1cdbd2cSJim Jagielski   { 0x00BC, { 0x0031, 0x002F, 0x0034, 0x0000, 0x0000  } },  /* VULGAR FRACTION ONE QUARTER */
383*b1cdbd2cSJim Jagielski   { 0x00BD, { 0x0031, 0x002F, 0x0032, 0x0000, 0x0000  } },  /* VULGAR FRACTION ONE HALF */
384*b1cdbd2cSJim Jagielski   { 0x00BE, { 0x0033, 0x002F, 0x0034, 0x0000, 0x0000  } },  /* VULGAR FRACTION THREE QUARTERS */
385*b1cdbd2cSJim Jagielski   { 0x00C6, { 0x0041, 0x0045, 0x0000, 0x0000, 0x0000  } },  /* LATIN CAPITAL LETTER AE */
386*b1cdbd2cSJim Jagielski   { 0x00E6, { 0x0061, 0x0065, 0x0000, 0x0000, 0x0000  } },  /* LATIN SMALL LETTER AE */
387*b1cdbd2cSJim Jagielski   { 0x0152, { 0x004F, 0x0045, 0x0000, 0x0000, 0x0000  } },  /* LATIN CAPITAL LIGATURE OE */
388*b1cdbd2cSJim Jagielski   { 0x0153, { 0x006F, 0x0065, 0x0000, 0x0000, 0x0000  } },  /* LATIN SMALL LIGATURE OE */
389*b1cdbd2cSJim Jagielski   { 0x2025, { 0x002E, 0x002E, 0x0000, 0x0000, 0x0000  } },  /* TWO DOT LEADER */
390*b1cdbd2cSJim Jagielski   { 0x2026, { 0x002E, 0x002E, 0x002E, 0x0000, 0x0000  } },  /* HORIZONTAL ELLIPSES */
391*b1cdbd2cSJim Jagielski   { 0x2034, { 0x0027, 0x0027, 0x0027, 0x0000, 0x0000  } },  /* TRIPPLE PRIME */
392*b1cdbd2cSJim Jagielski   { 0x2037, { 0x0027, 0x0027, 0x0027, 0x0000, 0x0000  } },  /* RESERVED TRIPPLE PRIME */
393*b1cdbd2cSJim Jagielski   { 0x20AC, { 0x0045, 0x0055, 0x0052, 0x0000, 0x0000  } },  /* EURO SIGN */
394*b1cdbd2cSJim Jagielski   { 0x2122, { 0x0028, 0x0074, 0x006D, 0x0029, 0x0000  } },  /* TRADE MARK SIGN */
395*b1cdbd2cSJim Jagielski   { 0x2153, { 0x0031, 0x002F, 0x0033, 0x0000, 0x0000  } },  /* VULGAR FRACTION ONE THIRD */
396*b1cdbd2cSJim Jagielski   { 0x2154, { 0x0032, 0x002F, 0x0033, 0x0000, 0x0000  } },  /* VULGAR FRACTION TWO THIRD */
397*b1cdbd2cSJim Jagielski   { 0x2155, { 0x0031, 0x002F, 0x0035, 0x0000, 0x0000  } },  /* VULGAR FRACTION ONE FIFTH */
398*b1cdbd2cSJim Jagielski   { 0x2156, { 0x0032, 0x002F, 0x0035, 0x0000, 0x0000  } },  /* VULGAR FRACTION TWO FIFTH */
399*b1cdbd2cSJim Jagielski   { 0x2157, { 0x0033, 0x002F, 0x0035, 0x0000, 0x0000  } },  /* VULGAR FRACTION THREE FIFTH */
400*b1cdbd2cSJim Jagielski   { 0x2158, { 0x0034, 0x002F, 0x0035, 0x0000, 0x0000  } },  /* VULGAR FRACTION FOUR FIFTH */
401*b1cdbd2cSJim Jagielski   { 0x2159, { 0x0031, 0x002F, 0x0036, 0x0000, 0x0000  } },  /* VULGAR FRACTION ONE SIXTH */
402*b1cdbd2cSJim Jagielski   { 0x215A, { 0x0035, 0x002F, 0x0036, 0x0000, 0x0000  } },  /* VULGAR FRACTION FIVE SIXTH */
403*b1cdbd2cSJim Jagielski   { 0x215B, { 0x0031, 0x002F, 0x0038, 0x0000, 0x0000  } },  /* VULGAR FRACTION ONE EIGHTH */
404*b1cdbd2cSJim Jagielski   { 0x215C, { 0x0033, 0x002F, 0x0038, 0x0000, 0x0000  } },  /* VULGAR FRACTION THREE EIGHTH */
405*b1cdbd2cSJim Jagielski   { 0x215D, { 0x0035, 0x002F, 0x0038, 0x0000, 0x0000  } },  /* VULGAR FRACTION FIVE EIGHTH */
406*b1cdbd2cSJim Jagielski   { 0x215E, { 0x0037, 0x002F, 0x0038, 0x0000, 0x0000  } },  /* VULGAR FRACTION SEVEN EIGHTH */
407*b1cdbd2cSJim Jagielski   { 0x215F, { 0x0031, 0x002F, 0x0000, 0x0000, 0x0000  } },  /* FRACTION NUMERATOR ONE */
408*b1cdbd2cSJim Jagielski   { 0x2161, { 0x0049, 0x0049, 0x0000, 0x0000, 0x0000  } },  /* ROMAN NUMERAL TWO */
409*b1cdbd2cSJim Jagielski   { 0x2162, { 0x0049, 0x0049, 0x0049, 0x0000, 0x0000  } },  /* ROMAN NUMERAL THREE */
410*b1cdbd2cSJim Jagielski   { 0x2163, { 0x0049, 0x0056, 0x0000, 0x0000, 0x0000  } },  /* ROMAN NUMERAL FOUR */
411*b1cdbd2cSJim Jagielski   { 0x2165, { 0x0056, 0x0049, 0x0000, 0x0000, 0x0000  } },  /* ROMAN NUMERAL SIX */
412*b1cdbd2cSJim Jagielski   { 0x2166, { 0x0056, 0x0049, 0x0049, 0x0000, 0x0000  } },  /* ROMAN NUMERAL SEVEN */
413*b1cdbd2cSJim Jagielski   { 0x2168, { 0x0056, 0x0049, 0x0049, 0x0049, 0x0000  } },  /* ROMAN NUMERAL EIGHT */
414*b1cdbd2cSJim Jagielski   { 0x2169, { 0x0049, 0x0058, 0x0000, 0x0000, 0x0000  } },  /* ROMAN NUMERAL NINE */
415*b1cdbd2cSJim Jagielski   { 0x216A, { 0x0058, 0x0049, 0x0000, 0x0000, 0x0000  } },  /* ROMAN NUMERAL ELEVEN */
416*b1cdbd2cSJim Jagielski   { 0x216B, { 0x0058, 0x0049, 0x0049, 0x0000, 0x0000  } },  /* ROMAN NUMERAL TWELVE */
417*b1cdbd2cSJim Jagielski   { 0x2171, { 0x0069, 0x0069, 0x0000, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL TWO */
418*b1cdbd2cSJim Jagielski   { 0x2172, { 0x0069, 0x0069, 0x0069, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL THREE */
419*b1cdbd2cSJim Jagielski   { 0x2173, { 0x0069, 0x0076, 0x0000, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL FOUR */
420*b1cdbd2cSJim Jagielski   { 0x2175, { 0x0076, 0x0069, 0x0000, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL SIX */
421*b1cdbd2cSJim Jagielski   { 0x2176, { 0x0076, 0x0069, 0x0069, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL SEVEN */
422*b1cdbd2cSJim Jagielski   { 0x2178, { 0x0076, 0x0069, 0x0069, 0x0069, 0x0000  } },  /* SMALL ROMAN NUMERAL EIGHT */
423*b1cdbd2cSJim Jagielski   { 0x2179, { 0x0069, 0x0078, 0x0000, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL NINE */
424*b1cdbd2cSJim Jagielski   { 0x217A, { 0x0078, 0x0069, 0x0000, 0x0000, 0x0000  } },  /* SMALL ROMAN NUMERAL ELEVEN */
425*b1cdbd2cSJim Jagielski   { 0x217B, { 0x0058, 0x0069, 0x0069, 0x0000, 0x0000  } }   /* SMALL ROMAN NUMERAL TWELVE */
426*b1cdbd2cSJim Jagielski };
427*b1cdbd2cSJim Jagielski 
ImplGetReplaceString(sal_Unicode c)428*b1cdbd2cSJim Jagielski const sal_uInt16* ImplGetReplaceString( sal_Unicode c )
429*b1cdbd2cSJim Jagielski {
430*b1cdbd2cSJim Jagielski     sal_uInt16                      nLow;
431*b1cdbd2cSJim Jagielski     sal_uInt16                      nHigh;
432*b1cdbd2cSJim Jagielski     sal_uInt16                      nMid;
433*b1cdbd2cSJim Jagielski     sal_uInt16                      nCompareChar;
434*b1cdbd2cSJim Jagielski     const ImplReplaceCharStrData*   pCharData;
435*b1cdbd2cSJim Jagielski 
436*b1cdbd2cSJim Jagielski     nLow = 0;
437*b1cdbd2cSJim Jagielski     nHigh = (sizeof( aImplRepCharStrTab )/sizeof( ImplReplaceCharStrData ))-1;
438*b1cdbd2cSJim Jagielski     do
439*b1cdbd2cSJim Jagielski     {
440*b1cdbd2cSJim Jagielski         nMid = (nLow+nHigh)/2;
441*b1cdbd2cSJim Jagielski         pCharData = aImplRepCharStrTab+nMid;
442*b1cdbd2cSJim Jagielski         nCompareChar = pCharData->mnUniChar;
443*b1cdbd2cSJim Jagielski         if ( c < nCompareChar )
444*b1cdbd2cSJim Jagielski         {
445*b1cdbd2cSJim Jagielski             if ( !nMid )
446*b1cdbd2cSJim Jagielski                 break;
447*b1cdbd2cSJim Jagielski             nHigh = nMid-1;
448*b1cdbd2cSJim Jagielski         }
449*b1cdbd2cSJim Jagielski         else
450*b1cdbd2cSJim Jagielski         {
451*b1cdbd2cSJim Jagielski             if ( c > nCompareChar )
452*b1cdbd2cSJim Jagielski                 nLow = nMid+1;
453*b1cdbd2cSJim Jagielski             else
454*b1cdbd2cSJim Jagielski                 return pCharData->maReplaceChars;
455*b1cdbd2cSJim Jagielski         }
456*b1cdbd2cSJim Jagielski     }
457*b1cdbd2cSJim Jagielski     while ( nLow <= nHigh );
458*b1cdbd2cSJim Jagielski 
459*b1cdbd2cSJim Jagielski     return 0;
460*b1cdbd2cSJim Jagielski }
461*b1cdbd2cSJim Jagielski 
462*b1cdbd2cSJim Jagielski /* ======================================================================= */
463*b1cdbd2cSJim Jagielski 
ImplSymbolToUnicode(const ImplTextConverterData * pData,void * pContext,const sal_Char * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)464*b1cdbd2cSJim Jagielski sal_Size ImplSymbolToUnicode( const ImplTextConverterData* pData,
465*b1cdbd2cSJim Jagielski                               void* pContext,
466*b1cdbd2cSJim Jagielski                               const sal_Char* pSrcBuf, sal_Size nSrcBytes,
467*b1cdbd2cSJim Jagielski                               sal_Unicode* pDestBuf, sal_Size nDestChars,
468*b1cdbd2cSJim Jagielski                               sal_uInt32 nFlags, sal_uInt32* pInfo,
469*b1cdbd2cSJim Jagielski                               sal_Size* pSrcCvtBytes )
470*b1cdbd2cSJim Jagielski {
471*b1cdbd2cSJim Jagielski     sal_uChar               c;
472*b1cdbd2cSJim Jagielski     sal_Unicode*            pEndDestBuf;
473*b1cdbd2cSJim Jagielski     const sal_Char*         pEndSrcBuf;
474*b1cdbd2cSJim Jagielski 
475*b1cdbd2cSJim Jagielski     (void) pData; /* unused */
476*b1cdbd2cSJim Jagielski     (void) pContext; /* unused */
477*b1cdbd2cSJim Jagielski     (void) nFlags; /* unused */
478*b1cdbd2cSJim Jagielski 
479*b1cdbd2cSJim Jagielski     *pInfo = 0;
480*b1cdbd2cSJim Jagielski     pEndDestBuf = pDestBuf+nDestChars;
481*b1cdbd2cSJim Jagielski     pEndSrcBuf  = pSrcBuf+nSrcBytes;
482*b1cdbd2cSJim Jagielski     while ( pSrcBuf < pEndSrcBuf )
483*b1cdbd2cSJim Jagielski     {
484*b1cdbd2cSJim Jagielski         if ( pDestBuf == pEndDestBuf )
485*b1cdbd2cSJim Jagielski         {
486*b1cdbd2cSJim Jagielski             *pInfo |= RTL_TEXTTOUNICODE_INFO_ERROR | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
487*b1cdbd2cSJim Jagielski             break;
488*b1cdbd2cSJim Jagielski         }
489*b1cdbd2cSJim Jagielski 
490*b1cdbd2cSJim Jagielski         /* 0-31 (all Control-Character get the same Unicode value) */
491*b1cdbd2cSJim Jagielski         c = (sal_uChar)*pSrcBuf;
492*b1cdbd2cSJim Jagielski         if ( c <= 0x1F )
493*b1cdbd2cSJim Jagielski             *pDestBuf = (sal_Unicode)c;
494*b1cdbd2cSJim Jagielski         else
495*b1cdbd2cSJim Jagielski             *pDestBuf = ((sal_Unicode)c)+0xF000;
496*b1cdbd2cSJim Jagielski         pDestBuf++;
497*b1cdbd2cSJim Jagielski         pSrcBuf++;
498*b1cdbd2cSJim Jagielski     }
499*b1cdbd2cSJim Jagielski 
500*b1cdbd2cSJim Jagielski     *pSrcCvtBytes = nSrcBytes - (pEndSrcBuf-pSrcBuf);
501*b1cdbd2cSJim Jagielski     return (nDestChars - (pEndDestBuf-pDestBuf));
502*b1cdbd2cSJim Jagielski }
503*b1cdbd2cSJim Jagielski 
504*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
505*b1cdbd2cSJim Jagielski 
ImplUnicodeToSymbol(const ImplTextConverterData * pData,void * pContext,const sal_Unicode * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)506*b1cdbd2cSJim Jagielski sal_Size ImplUnicodeToSymbol( const ImplTextConverterData* pData,
507*b1cdbd2cSJim Jagielski                               void* pContext,
508*b1cdbd2cSJim Jagielski                               const sal_Unicode* pSrcBuf, sal_Size nSrcChars,
509*b1cdbd2cSJim Jagielski                               sal_Char* pDestBuf, sal_Size nDestBytes,
510*b1cdbd2cSJim Jagielski                               sal_uInt32 nFlags, sal_uInt32* pInfo,
511*b1cdbd2cSJim Jagielski                               sal_Size* pSrcCvtChars )
512*b1cdbd2cSJim Jagielski {
513*b1cdbd2cSJim Jagielski     sal_Unicode             c;
514*b1cdbd2cSJim Jagielski     sal_Char*               pEndDestBuf;
515*b1cdbd2cSJim Jagielski     const sal_Unicode*      pEndSrcBuf;
516*b1cdbd2cSJim Jagielski 
517*b1cdbd2cSJim Jagielski     (void) pContext; /* unused */
518*b1cdbd2cSJim Jagielski 
519*b1cdbd2cSJim Jagielski     *pInfo = 0;
520*b1cdbd2cSJim Jagielski     pEndDestBuf = pDestBuf+nDestBytes;
521*b1cdbd2cSJim Jagielski     pEndSrcBuf  = pSrcBuf+nSrcChars;
522*b1cdbd2cSJim Jagielski     while ( pSrcBuf < pEndSrcBuf )
523*b1cdbd2cSJim Jagielski     {
524*b1cdbd2cSJim Jagielski         if ( pDestBuf == pEndDestBuf )
525*b1cdbd2cSJim Jagielski         {
526*b1cdbd2cSJim Jagielski             *pInfo |= RTL_UNICODETOTEXT_INFO_ERROR | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
527*b1cdbd2cSJim Jagielski             break;
528*b1cdbd2cSJim Jagielski         }
529*b1cdbd2cSJim Jagielski 
530*b1cdbd2cSJim Jagielski         c = *pSrcBuf;
531*b1cdbd2cSJim Jagielski         if ( (c >= 0xF000) && (c <= 0xF0FF) )
532*b1cdbd2cSJim Jagielski         {
533*b1cdbd2cSJim Jagielski             *pDestBuf = (sal_Char)(sal_uChar)(c-0xF000);
534*b1cdbd2cSJim Jagielski             pDestBuf++;
535*b1cdbd2cSJim Jagielski             pSrcBuf++;
536*b1cdbd2cSJim Jagielski         }
537*b1cdbd2cSJim Jagielski         // Normally 0x001F, but in many cases also symbol characters
538*b1cdbd2cSJim Jagielski         // are stored in the first 256 bytes, so that we don't change
539*b1cdbd2cSJim Jagielski         // these values
540*b1cdbd2cSJim Jagielski         else if ( c <= 0x00FF )
541*b1cdbd2cSJim Jagielski         {
542*b1cdbd2cSJim Jagielski             *pDestBuf = (sal_Char)(sal_uChar)c;
543*b1cdbd2cSJim Jagielski             pDestBuf++;
544*b1cdbd2cSJim Jagielski             pSrcBuf++;
545*b1cdbd2cSJim Jagielski         }
546*b1cdbd2cSJim Jagielski         else
547*b1cdbd2cSJim Jagielski         {
548*b1cdbd2cSJim Jagielski             if ( nFlags & RTL_UNICODETOTEXT_FLAGS_UNDEFINED_REPLACE )
549*b1cdbd2cSJim Jagielski             {
550*b1cdbd2cSJim Jagielski                 /* !!! */
551*b1cdbd2cSJim Jagielski                 /* Only ascii  characters < 0x1F */
552*b1cdbd2cSJim Jagielski             }
553*b1cdbd2cSJim Jagielski 
554*b1cdbd2cSJim Jagielski             /* Handle undefined and surrogates characters */
555*b1cdbd2cSJim Jagielski             /* (all surrogates characters are undefined) */
556*b1cdbd2cSJim Jagielski             if (!ImplHandleUndefinedUnicodeToTextChar(pData,
557*b1cdbd2cSJim Jagielski                                                       &pSrcBuf,
558*b1cdbd2cSJim Jagielski                                                       pEndSrcBuf,
559*b1cdbd2cSJim Jagielski                                                       &pDestBuf,
560*b1cdbd2cSJim Jagielski                                                       pEndDestBuf,
561*b1cdbd2cSJim Jagielski                                                       nFlags,
562*b1cdbd2cSJim Jagielski                                                       pInfo))
563*b1cdbd2cSJim Jagielski                 break;
564*b1cdbd2cSJim Jagielski         }
565*b1cdbd2cSJim Jagielski     }
566*b1cdbd2cSJim Jagielski 
567*b1cdbd2cSJim Jagielski     *pSrcCvtChars = nSrcChars - (pEndSrcBuf-pSrcBuf);
568*b1cdbd2cSJim Jagielski     return (nDestBytes - (pEndDestBuf-pDestBuf));
569*b1cdbd2cSJim Jagielski }
570*b1cdbd2cSJim Jagielski 
571*b1cdbd2cSJim Jagielski /* ======================================================================= */
572*b1cdbd2cSJim Jagielski 
ImplCharToUnicode(const ImplTextConverterData * pData,void * pContext,const sal_Char * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)573*b1cdbd2cSJim Jagielski sal_Size ImplCharToUnicode( const ImplTextConverterData* pData,
574*b1cdbd2cSJim Jagielski                             void* pContext,
575*b1cdbd2cSJim Jagielski                             const sal_Char* pSrcBuf, sal_Size nSrcBytes,
576*b1cdbd2cSJim Jagielski                             sal_Unicode* pDestBuf, sal_Size nDestChars,
577*b1cdbd2cSJim Jagielski                             sal_uInt32 nFlags, sal_uInt32* pInfo,
578*b1cdbd2cSJim Jagielski                             sal_Size* pSrcCvtBytes )
579*b1cdbd2cSJim Jagielski {
580*b1cdbd2cSJim Jagielski     sal_uChar                   c;
581*b1cdbd2cSJim Jagielski     sal_Unicode                 cConv;
582*b1cdbd2cSJim Jagielski     const ImplByteConvertData*  pConvertData = (const ImplByteConvertData*)pData;
583*b1cdbd2cSJim Jagielski     sal_Unicode*                pEndDestBuf;
584*b1cdbd2cSJim Jagielski     const sal_Char*             pEndSrcBuf;
585*b1cdbd2cSJim Jagielski 
586*b1cdbd2cSJim Jagielski     (void) pContext; /* unused */
587*b1cdbd2cSJim Jagielski 
588*b1cdbd2cSJim Jagielski     *pInfo = 0;
589*b1cdbd2cSJim Jagielski     pEndDestBuf = pDestBuf+nDestChars;
590*b1cdbd2cSJim Jagielski     pEndSrcBuf  = pSrcBuf+nSrcBytes;
591*b1cdbd2cSJim Jagielski     while ( pSrcBuf < pEndSrcBuf )
592*b1cdbd2cSJim Jagielski     {
593*b1cdbd2cSJim Jagielski         c = (sal_uChar)*pSrcBuf;
594*b1cdbd2cSJim Jagielski         if ( c < 0x80 )
595*b1cdbd2cSJim Jagielski             cConv = c;
596*b1cdbd2cSJim Jagielski         else
597*b1cdbd2cSJim Jagielski         {
598*b1cdbd2cSJim Jagielski             if ( (c >= pConvertData->mnToUniStart1) && (c <= pConvertData->mnToUniEnd1) )
599*b1cdbd2cSJim Jagielski                 cConv = pConvertData->mpToUniTab1[c-pConvertData->mnToUniStart1];
600*b1cdbd2cSJim Jagielski             else if ( (c >= pConvertData->mnToUniStart2) && (c <= pConvertData->mnToUniEnd2) )
601*b1cdbd2cSJim Jagielski                 cConv = pConvertData->mpToUniTab2[c-pConvertData->mnToUniStart2];
602*b1cdbd2cSJim Jagielski             else
603*b1cdbd2cSJim Jagielski                 cConv = 0;
604*b1cdbd2cSJim Jagielski             if ( !cConv )
605*b1cdbd2cSJim Jagielski             {
606*b1cdbd2cSJim Jagielski                 *pInfo |= RTL_TEXTTOUNICODE_INFO_UNDEFINED;
607*b1cdbd2cSJim Jagielski                 if ( (nFlags & RTL_TEXTTOUNICODE_FLAGS_UNDEFINED_MASK) == RTL_TEXTTOUNICODE_FLAGS_UNDEFINED_ERROR )
608*b1cdbd2cSJim Jagielski                 {
609*b1cdbd2cSJim Jagielski                     *pInfo |= RTL_TEXTTOUNICODE_INFO_ERROR;
610*b1cdbd2cSJim Jagielski                     break;
611*b1cdbd2cSJim Jagielski                 }
612*b1cdbd2cSJim Jagielski                 else if ( (nFlags & RTL_TEXTTOUNICODE_FLAGS_UNDEFINED_MASK) == RTL_TEXTTOUNICODE_FLAGS_UNDEFINED_IGNORE )
613*b1cdbd2cSJim Jagielski                 {
614*b1cdbd2cSJim Jagielski                     pSrcBuf++;
615*b1cdbd2cSJim Jagielski                     continue;
616*b1cdbd2cSJim Jagielski                 }
617*b1cdbd2cSJim Jagielski                 else
618*b1cdbd2cSJim Jagielski                     cConv = ImplGetUndefinedUnicodeChar(c, nFlags);
619*b1cdbd2cSJim Jagielski             }
620*b1cdbd2cSJim Jagielski         }
621*b1cdbd2cSJim Jagielski 
622*b1cdbd2cSJim Jagielski         if ( pDestBuf == pEndDestBuf )
623*b1cdbd2cSJim Jagielski         {
624*b1cdbd2cSJim Jagielski             *pInfo |= RTL_TEXTTOUNICODE_INFO_ERROR | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
625*b1cdbd2cSJim Jagielski             break;
626*b1cdbd2cSJim Jagielski         }
627*b1cdbd2cSJim Jagielski 
628*b1cdbd2cSJim Jagielski         *pDestBuf = cConv;
629*b1cdbd2cSJim Jagielski         pDestBuf++;
630*b1cdbd2cSJim Jagielski         pSrcBuf++;
631*b1cdbd2cSJim Jagielski     }
632*b1cdbd2cSJim Jagielski 
633*b1cdbd2cSJim Jagielski     *pSrcCvtBytes = nSrcBytes - (pEndSrcBuf-pSrcBuf);
634*b1cdbd2cSJim Jagielski     return (nDestChars - (pEndDestBuf-pDestBuf));
635*b1cdbd2cSJim Jagielski }
636*b1cdbd2cSJim Jagielski 
637*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
638*b1cdbd2cSJim Jagielski 
639*b1cdbd2cSJim Jagielski // Writes 0--2 characters to dest:
ImplConvertUnicodeCharToChar(const ImplByteConvertData * pConvertData,sal_Unicode c,sal_Char * dest)640*b1cdbd2cSJim Jagielski static int ImplConvertUnicodeCharToChar(
641*b1cdbd2cSJim Jagielski     const ImplByteConvertData* pConvertData, sal_Unicode c, sal_Char * dest )
642*b1cdbd2cSJim Jagielski {
643*b1cdbd2cSJim Jagielski     const ImplUniCharTabData*   pToCharExTab;
644*b1cdbd2cSJim Jagielski 
645*b1cdbd2cSJim Jagielski     if ( c < 0x80 )
646*b1cdbd2cSJim Jagielski     {
647*b1cdbd2cSJim Jagielski         dest[0] = (sal_Char)c;
648*b1cdbd2cSJim Jagielski         return 1;
649*b1cdbd2cSJim Jagielski     }
650*b1cdbd2cSJim Jagielski     if ( (c >= pConvertData->mnToCharStart1) && (c <= pConvertData->mnToCharEnd1) )
651*b1cdbd2cSJim Jagielski     {
652*b1cdbd2cSJim Jagielski         dest[0] = (sal_Char)pConvertData->mpToCharTab1[c-pConvertData->mnToCharStart1];
653*b1cdbd2cSJim Jagielski         if ( dest[0] != 0 )
654*b1cdbd2cSJim Jagielski             return 1;
655*b1cdbd2cSJim Jagielski     }
656*b1cdbd2cSJim Jagielski     else if ( (c >= pConvertData->mnToCharStart2) && (c <= pConvertData->mnToCharEnd2) )
657*b1cdbd2cSJim Jagielski     {
658*b1cdbd2cSJim Jagielski         dest[0] = (sal_Char)pConvertData->mpToCharTab2[c-pConvertData->mnToCharStart2];
659*b1cdbd2cSJim Jagielski         if ( dest[0] != 0 )
660*b1cdbd2cSJim Jagielski             return 1;
661*b1cdbd2cSJim Jagielski     }
662*b1cdbd2cSJim Jagielski     pToCharExTab = pConvertData->mpToCharExTab;
663*b1cdbd2cSJim Jagielski     if ( pToCharExTab )
664*b1cdbd2cSJim Jagielski     {
665*b1cdbd2cSJim Jagielski         sal_uInt16                  nLow;
666*b1cdbd2cSJim Jagielski         sal_uInt16                  nHigh;
667*b1cdbd2cSJim Jagielski         sal_uInt16                  nMid;
668*b1cdbd2cSJim Jagielski         sal_uInt16                  nCompareChar;
669*b1cdbd2cSJim Jagielski         const ImplUniCharTabData*   pCharExData;
670*b1cdbd2cSJim Jagielski 
671*b1cdbd2cSJim Jagielski         nLow = 0;
672*b1cdbd2cSJim Jagielski         nHigh = pConvertData->mnToCharExCount-1;
673*b1cdbd2cSJim Jagielski         do
674*b1cdbd2cSJim Jagielski         {
675*b1cdbd2cSJim Jagielski             nMid = (nLow+nHigh)/2;
676*b1cdbd2cSJim Jagielski             pCharExData = pToCharExTab+nMid;
677*b1cdbd2cSJim Jagielski             nCompareChar = pCharExData->mnUniChar;
678*b1cdbd2cSJim Jagielski             if ( c < nCompareChar )
679*b1cdbd2cSJim Jagielski             {
680*b1cdbd2cSJim Jagielski                 if ( !nMid )
681*b1cdbd2cSJim Jagielski                     break;
682*b1cdbd2cSJim Jagielski                 nHigh = nMid-1;
683*b1cdbd2cSJim Jagielski             }
684*b1cdbd2cSJim Jagielski             else
685*b1cdbd2cSJim Jagielski             {
686*b1cdbd2cSJim Jagielski                 if ( c > nCompareChar )
687*b1cdbd2cSJim Jagielski                     nLow = nMid+1;
688*b1cdbd2cSJim Jagielski                 else
689*b1cdbd2cSJim Jagielski                 {
690*b1cdbd2cSJim Jagielski                     dest[0] = (sal_Char)pCharExData->mnChar;
691*b1cdbd2cSJim Jagielski                     if ( pCharExData->mnChar2 == 0 )
692*b1cdbd2cSJim Jagielski                         return 1;
693*b1cdbd2cSJim Jagielski                     else
694*b1cdbd2cSJim Jagielski                     {
695*b1cdbd2cSJim Jagielski                         dest[1] = (sal_Char)pCharExData->mnChar2;
696*b1cdbd2cSJim Jagielski                         return 2;
697*b1cdbd2cSJim Jagielski                     }
698*b1cdbd2cSJim Jagielski                 }
699*b1cdbd2cSJim Jagielski             }
700*b1cdbd2cSJim Jagielski         }
701*b1cdbd2cSJim Jagielski         while ( nLow <= nHigh );
702*b1cdbd2cSJim Jagielski     }
703*b1cdbd2cSJim Jagielski     return 0;
704*b1cdbd2cSJim Jagielski }
705*b1cdbd2cSJim Jagielski 
706*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
707*b1cdbd2cSJim Jagielski 
ImplUnicodeToChar(const ImplTextConverterData * pData,void * pContext,const sal_Unicode * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)708*b1cdbd2cSJim Jagielski sal_Size ImplUnicodeToChar( const ImplTextConverterData* pData,
709*b1cdbd2cSJim Jagielski                             void* pContext,
710*b1cdbd2cSJim Jagielski                             const sal_Unicode* pSrcBuf, sal_Size nSrcChars,
711*b1cdbd2cSJim Jagielski                             sal_Char* pDestBuf, sal_Size nDestBytes,
712*b1cdbd2cSJim Jagielski                             sal_uInt32 nFlags, sal_uInt32* pInfo,
713*b1cdbd2cSJim Jagielski                             sal_Size* pSrcCvtChars )
714*b1cdbd2cSJim Jagielski {
715*b1cdbd2cSJim Jagielski     sal_Unicode                 c;
716*b1cdbd2cSJim Jagielski     const ImplByteConvertData*  pConvertData = (const ImplByteConvertData*)pData;
717*b1cdbd2cSJim Jagielski     sal_Char*                   pEndDestBuf;
718*b1cdbd2cSJim Jagielski     const sal_Unicode*          pEndSrcBuf;
719*b1cdbd2cSJim Jagielski     int                         i;
720*b1cdbd2cSJim Jagielski     int                         n;
721*b1cdbd2cSJim Jagielski     sal_uInt16                  cTemp;
722*b1cdbd2cSJim Jagielski     sal_Char                    aTempBuf[IMPL_MAX_REPLACECHAR+2];
723*b1cdbd2cSJim Jagielski     const sal_uInt16*           pReplace;
724*b1cdbd2cSJim Jagielski 
725*b1cdbd2cSJim Jagielski     (void) pContext; /* unused */
726*b1cdbd2cSJim Jagielski 
727*b1cdbd2cSJim Jagielski     *pInfo = 0;
728*b1cdbd2cSJim Jagielski     pEndDestBuf = pDestBuf+nDestBytes;
729*b1cdbd2cSJim Jagielski     pEndSrcBuf  = pSrcBuf+nSrcChars;
730*b1cdbd2cSJim Jagielski     while ( pSrcBuf < pEndSrcBuf )
731*b1cdbd2cSJim Jagielski     {
732*b1cdbd2cSJim Jagielski         c = *pSrcBuf;
733*b1cdbd2cSJim Jagielski         if ( c < 0x80 )
734*b1cdbd2cSJim Jagielski         {
735*b1cdbd2cSJim Jagielski             aTempBuf[0] = (sal_Char)c;
736*b1cdbd2cSJim Jagielski             n = 1;
737*b1cdbd2cSJim Jagielski         }
738*b1cdbd2cSJim Jagielski         else
739*b1cdbd2cSJim Jagielski         {
740*b1cdbd2cSJim Jagielski             n = ImplConvertUnicodeCharToChar( pConvertData, c, aTempBuf );
741*b1cdbd2cSJim Jagielski 
742*b1cdbd2cSJim Jagielski             if ( n == 0 )
743*b1cdbd2cSJim Jagielski             {
744*b1cdbd2cSJim Jagielski                 if ( nFlags & RTL_UNICODETOTEXT_FLAGS_UNDEFINED_REPLACE )
745*b1cdbd2cSJim Jagielski                 {
746*b1cdbd2cSJim Jagielski                     cTemp = ImplGetReplaceChar( c );
747*b1cdbd2cSJim Jagielski                     if ( cTemp )
748*b1cdbd2cSJim Jagielski                         n = ImplConvertUnicodeCharToChar(
749*b1cdbd2cSJim Jagielski                             pConvertData, cTemp, aTempBuf );
750*b1cdbd2cSJim Jagielski                 }
751*b1cdbd2cSJim Jagielski 
752*b1cdbd2cSJim Jagielski                 if ( n == 0 )
753*b1cdbd2cSJim Jagielski                 {
754*b1cdbd2cSJim Jagielski                     if ( nFlags & RTL_UNICODETOTEXT_FLAGS_UNDEFINED_REPLACESTR )
755*b1cdbd2cSJim Jagielski                     {
756*b1cdbd2cSJim Jagielski                         pReplace = ImplGetReplaceString( c );
757*b1cdbd2cSJim Jagielski                         if ( pReplace )
758*b1cdbd2cSJim Jagielski                         {
759*b1cdbd2cSJim Jagielski                             while ( *pReplace && (n < IMPL_MAX_REPLACECHAR) )
760*b1cdbd2cSJim Jagielski                             {
761*b1cdbd2cSJim Jagielski                                 i = ImplConvertUnicodeCharToChar(
762*b1cdbd2cSJim Jagielski                                     pConvertData, *pReplace, aTempBuf + n );
763*b1cdbd2cSJim Jagielski                                 if ( i == 0 )
764*b1cdbd2cSJim Jagielski                                 {
765*b1cdbd2cSJim Jagielski                                     n = 0;
766*b1cdbd2cSJim Jagielski                                     break;
767*b1cdbd2cSJim Jagielski                                 }
768*b1cdbd2cSJim Jagielski                                 pReplace++;
769*b1cdbd2cSJim Jagielski                                 n += i;
770*b1cdbd2cSJim Jagielski                             }
771*b1cdbd2cSJim Jagielski                         }
772*b1cdbd2cSJim Jagielski                     }
773*b1cdbd2cSJim Jagielski 
774*b1cdbd2cSJim Jagielski                     /* Handle undefined and surrogates characters */
775*b1cdbd2cSJim Jagielski                     /* (all surrogates characters are undefined) */
776*b1cdbd2cSJim Jagielski                     if ( n == 0 )
777*b1cdbd2cSJim Jagielski                     {
778*b1cdbd2cSJim Jagielski                         if (ImplHandleUndefinedUnicodeToTextChar(pData,
779*b1cdbd2cSJim Jagielski                                                                  &pSrcBuf,
780*b1cdbd2cSJim Jagielski                                                                  pEndSrcBuf,
781*b1cdbd2cSJim Jagielski                                                                  &pDestBuf,
782*b1cdbd2cSJim Jagielski                                                                  pEndDestBuf,
783*b1cdbd2cSJim Jagielski                                                                  nFlags,
784*b1cdbd2cSJim Jagielski                                                                  pInfo))
785*b1cdbd2cSJim Jagielski                             continue;
786*b1cdbd2cSJim Jagielski                         else
787*b1cdbd2cSJim Jagielski                             break;
788*b1cdbd2cSJim Jagielski                     }
789*b1cdbd2cSJim Jagielski                 }
790*b1cdbd2cSJim Jagielski             }
791*b1cdbd2cSJim Jagielski         }
792*b1cdbd2cSJim Jagielski 
793*b1cdbd2cSJim Jagielski         if ( pEndDestBuf - pDestBuf < n )
794*b1cdbd2cSJim Jagielski         {
795*b1cdbd2cSJim Jagielski             *pInfo |= RTL_UNICODETOTEXT_INFO_ERROR | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
796*b1cdbd2cSJim Jagielski             break;
797*b1cdbd2cSJim Jagielski         }
798*b1cdbd2cSJim Jagielski 
799*b1cdbd2cSJim Jagielski         for ( i = 0; i < n; ++i )
800*b1cdbd2cSJim Jagielski             *pDestBuf++ = aTempBuf[i];
801*b1cdbd2cSJim Jagielski         pSrcBuf++;
802*b1cdbd2cSJim Jagielski     }
803*b1cdbd2cSJim Jagielski 
804*b1cdbd2cSJim Jagielski     *pSrcCvtChars = nSrcChars - (pEndSrcBuf-pSrcBuf);
805*b1cdbd2cSJim Jagielski     return (nDestBytes - (pEndDestBuf-pDestBuf));
806*b1cdbd2cSJim Jagielski }
807