1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski *
3*b1cdbd2cSJim Jagielski * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski * or more contributor license agreements. See the NOTICE file
5*b1cdbd2cSJim Jagielski * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski * regarding copyright ownership. The ASF licenses this file
7*b1cdbd2cSJim Jagielski * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski * with the License. You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski *
11*b1cdbd2cSJim Jagielski * http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski *
13*b1cdbd2cSJim Jagielski * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski * KIND, either express or implied. See the License for the
17*b1cdbd2cSJim Jagielski * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski * under the License.
19*b1cdbd2cSJim Jagielski *
20*b1cdbd2cSJim Jagielski *************************************************************/
21*b1cdbd2cSJim Jagielski
22*b1cdbd2cSJim Jagielski
23*b1cdbd2cSJim Jagielski
24*b1cdbd2cSJim Jagielski #include "convertiso2022kr.h"
25*b1cdbd2cSJim Jagielski #include "context.h"
26*b1cdbd2cSJim Jagielski #include "converter.h"
27*b1cdbd2cSJim Jagielski #include "tenchelp.h"
28*b1cdbd2cSJim Jagielski #include "unichars.h"
29*b1cdbd2cSJim Jagielski #include "rtl/alloc.h"
30*b1cdbd2cSJim Jagielski #include "rtl/textcvt.h"
31*b1cdbd2cSJim Jagielski #include "sal/types.h"
32*b1cdbd2cSJim Jagielski
33*b1cdbd2cSJim Jagielski typedef enum /* order is important: */
34*b1cdbd2cSJim Jagielski {
35*b1cdbd2cSJim Jagielski IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII,
36*b1cdbd2cSJim Jagielski IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001,
37*b1cdbd2cSJim Jagielski IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001_2,
38*b1cdbd2cSJim Jagielski IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC,
39*b1cdbd2cSJim Jagielski IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR,
40*b1cdbd2cSJim Jagielski IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR_RPAREN
41*b1cdbd2cSJim Jagielski } ImplIso2022KrToUnicodeState;
42*b1cdbd2cSJim Jagielski
43*b1cdbd2cSJim Jagielski typedef struct
44*b1cdbd2cSJim Jagielski {
45*b1cdbd2cSJim Jagielski ImplIso2022KrToUnicodeState m_eState;
46*b1cdbd2cSJim Jagielski sal_uInt32 m_nRow;
47*b1cdbd2cSJim Jagielski } ImplIso2022KrToUnicodeContext;
48*b1cdbd2cSJim Jagielski
49*b1cdbd2cSJim Jagielski typedef enum
50*b1cdbd2cSJim Jagielski {
51*b1cdbd2cSJim Jagielski IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE,
52*b1cdbd2cSJim Jagielski IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII,
53*b1cdbd2cSJim Jagielski IMPL_UNICODE_TO_ISO_2022_KR_SET_1001
54*b1cdbd2cSJim Jagielski } ImplUnicodeToIso2022KrSet;
55*b1cdbd2cSJim Jagielski
56*b1cdbd2cSJim Jagielski typedef struct
57*b1cdbd2cSJim Jagielski {
58*b1cdbd2cSJim Jagielski sal_Unicode m_nHighSurrogate;
59*b1cdbd2cSJim Jagielski ImplUnicodeToIso2022KrSet m_eSet;
60*b1cdbd2cSJim Jagielski } ImplUnicodeToIso2022KrContext;
61*b1cdbd2cSJim Jagielski
ImplCreateIso2022KrToUnicodeContext(void)62*b1cdbd2cSJim Jagielski void * ImplCreateIso2022KrToUnicodeContext(void)
63*b1cdbd2cSJim Jagielski {
64*b1cdbd2cSJim Jagielski void * pContext
65*b1cdbd2cSJim Jagielski = rtl_allocateMemory(sizeof (ImplIso2022KrToUnicodeContext));
66*b1cdbd2cSJim Jagielski ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState
67*b1cdbd2cSJim Jagielski = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
68*b1cdbd2cSJim Jagielski return pContext;
69*b1cdbd2cSJim Jagielski }
70*b1cdbd2cSJim Jagielski
ImplResetIso2022KrToUnicodeContext(void * pContext)71*b1cdbd2cSJim Jagielski void ImplResetIso2022KrToUnicodeContext(void * pContext)
72*b1cdbd2cSJim Jagielski {
73*b1cdbd2cSJim Jagielski if (pContext)
74*b1cdbd2cSJim Jagielski ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState
75*b1cdbd2cSJim Jagielski = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
76*b1cdbd2cSJim Jagielski }
77*b1cdbd2cSJim Jagielski
ImplConvertIso2022KrToUnicode(ImplTextConverterData const * pData,void * pContext,sal_Char const * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)78*b1cdbd2cSJim Jagielski sal_Size ImplConvertIso2022KrToUnicode(ImplTextConverterData const * pData,
79*b1cdbd2cSJim Jagielski void * pContext,
80*b1cdbd2cSJim Jagielski sal_Char const * pSrcBuf,
81*b1cdbd2cSJim Jagielski sal_Size nSrcBytes,
82*b1cdbd2cSJim Jagielski sal_Unicode * pDestBuf,
83*b1cdbd2cSJim Jagielski sal_Size nDestChars,
84*b1cdbd2cSJim Jagielski sal_uInt32 nFlags,
85*b1cdbd2cSJim Jagielski sal_uInt32 * pInfo,
86*b1cdbd2cSJim Jagielski sal_Size * pSrcCvtBytes)
87*b1cdbd2cSJim Jagielski {
88*b1cdbd2cSJim Jagielski ImplDBCSToUniLeadTab const * pKsX1001Data
89*b1cdbd2cSJim Jagielski = ((ImplIso2022KrConverterData const *) pData)->
90*b1cdbd2cSJim Jagielski m_pKsX1001ToUnicodeData;
91*b1cdbd2cSJim Jagielski ImplIso2022KrToUnicodeState eState
92*b1cdbd2cSJim Jagielski = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
93*b1cdbd2cSJim Jagielski sal_uInt32 nRow = 0;
94*b1cdbd2cSJim Jagielski sal_uInt32 nInfo = 0;
95*b1cdbd2cSJim Jagielski sal_Size nConverted = 0;
96*b1cdbd2cSJim Jagielski sal_Unicode * pDestBufPtr = pDestBuf;
97*b1cdbd2cSJim Jagielski sal_Unicode * pDestBufEnd = pDestBuf + nDestChars;
98*b1cdbd2cSJim Jagielski
99*b1cdbd2cSJim Jagielski if (pContext)
100*b1cdbd2cSJim Jagielski {
101*b1cdbd2cSJim Jagielski eState = ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState;
102*b1cdbd2cSJim Jagielski nRow = ((ImplIso2022KrToUnicodeContext *) pContext)->m_nRow;
103*b1cdbd2cSJim Jagielski }
104*b1cdbd2cSJim Jagielski
105*b1cdbd2cSJim Jagielski for (; nConverted < nSrcBytes; ++nConverted)
106*b1cdbd2cSJim Jagielski {
107*b1cdbd2cSJim Jagielski sal_Bool bUndefined = sal_True;
108*b1cdbd2cSJim Jagielski sal_uInt32 nChar = *(sal_uChar const *) pSrcBuf++;
109*b1cdbd2cSJim Jagielski switch (eState)
110*b1cdbd2cSJim Jagielski {
111*b1cdbd2cSJim Jagielski case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII:
112*b1cdbd2cSJim Jagielski if (nChar == 0x0E) /* SO */
113*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001;
114*b1cdbd2cSJim Jagielski else if (nChar == 0x1B) /* ESC */
115*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC;
116*b1cdbd2cSJim Jagielski else if (nChar < 0x80)
117*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
118*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Unicode) nChar;
119*b1cdbd2cSJim Jagielski else
120*b1cdbd2cSJim Jagielski goto no_output;
121*b1cdbd2cSJim Jagielski else
122*b1cdbd2cSJim Jagielski {
123*b1cdbd2cSJim Jagielski bUndefined = sal_False;
124*b1cdbd2cSJim Jagielski goto bad_input;
125*b1cdbd2cSJim Jagielski }
126*b1cdbd2cSJim Jagielski break;
127*b1cdbd2cSJim Jagielski
128*b1cdbd2cSJim Jagielski case IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001:
129*b1cdbd2cSJim Jagielski if (nChar == 0x0F) /* SI */
130*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
131*b1cdbd2cSJim Jagielski else if (nChar >= 0x21 && nChar <= 0x7E)
132*b1cdbd2cSJim Jagielski {
133*b1cdbd2cSJim Jagielski nRow = nChar + 0x80;
134*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001_2;
135*b1cdbd2cSJim Jagielski }
136*b1cdbd2cSJim Jagielski else
137*b1cdbd2cSJim Jagielski {
138*b1cdbd2cSJim Jagielski bUndefined = sal_False;
139*b1cdbd2cSJim Jagielski goto bad_input;
140*b1cdbd2cSJim Jagielski }
141*b1cdbd2cSJim Jagielski break;
142*b1cdbd2cSJim Jagielski
143*b1cdbd2cSJim Jagielski case IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001_2:
144*b1cdbd2cSJim Jagielski if (nChar >= 0x21 && nChar <= 0x7E)
145*b1cdbd2cSJim Jagielski {
146*b1cdbd2cSJim Jagielski sal_uInt16 nUnicode = 0;
147*b1cdbd2cSJim Jagielski sal_uInt32 nFirst = pKsX1001Data[nRow].mnTrailStart;
148*b1cdbd2cSJim Jagielski nChar += 0x80;
149*b1cdbd2cSJim Jagielski if (nChar >= nFirst && nChar <= pKsX1001Data[nRow].mnTrailEnd)
150*b1cdbd2cSJim Jagielski nUnicode = pKsX1001Data[nRow].
151*b1cdbd2cSJim Jagielski mpToUniTrailTab[nChar - nFirst];
152*b1cdbd2cSJim Jagielski if (nUnicode != 0)
153*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
154*b1cdbd2cSJim Jagielski {
155*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Unicode) nUnicode;
156*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001;
157*b1cdbd2cSJim Jagielski }
158*b1cdbd2cSJim Jagielski else
159*b1cdbd2cSJim Jagielski goto no_output;
160*b1cdbd2cSJim Jagielski else
161*b1cdbd2cSJim Jagielski goto bad_input;
162*b1cdbd2cSJim Jagielski }
163*b1cdbd2cSJim Jagielski else
164*b1cdbd2cSJim Jagielski {
165*b1cdbd2cSJim Jagielski bUndefined = sal_False;
166*b1cdbd2cSJim Jagielski goto bad_input;
167*b1cdbd2cSJim Jagielski }
168*b1cdbd2cSJim Jagielski break;
169*b1cdbd2cSJim Jagielski
170*b1cdbd2cSJim Jagielski case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC:
171*b1cdbd2cSJim Jagielski if (nChar == 0x24) /* $ */
172*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR;
173*b1cdbd2cSJim Jagielski else
174*b1cdbd2cSJim Jagielski {
175*b1cdbd2cSJim Jagielski bUndefined = sal_False;
176*b1cdbd2cSJim Jagielski goto bad_input;
177*b1cdbd2cSJim Jagielski }
178*b1cdbd2cSJim Jagielski break;
179*b1cdbd2cSJim Jagielski
180*b1cdbd2cSJim Jagielski case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR:
181*b1cdbd2cSJim Jagielski if (nChar == 0x29) /* ) */
182*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR_RPAREN;
183*b1cdbd2cSJim Jagielski else
184*b1cdbd2cSJim Jagielski {
185*b1cdbd2cSJim Jagielski bUndefined = sal_False;
186*b1cdbd2cSJim Jagielski goto bad_input;
187*b1cdbd2cSJim Jagielski }
188*b1cdbd2cSJim Jagielski break;
189*b1cdbd2cSJim Jagielski
190*b1cdbd2cSJim Jagielski case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR_RPAREN:
191*b1cdbd2cSJim Jagielski if (nChar == 0x43) /* C */
192*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
193*b1cdbd2cSJim Jagielski else
194*b1cdbd2cSJim Jagielski {
195*b1cdbd2cSJim Jagielski bUndefined = sal_False;
196*b1cdbd2cSJim Jagielski goto bad_input;
197*b1cdbd2cSJim Jagielski }
198*b1cdbd2cSJim Jagielski break;
199*b1cdbd2cSJim Jagielski }
200*b1cdbd2cSJim Jagielski continue;
201*b1cdbd2cSJim Jagielski
202*b1cdbd2cSJim Jagielski bad_input:
203*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputTextToUnicodeConversion(
204*b1cdbd2cSJim Jagielski bUndefined, sal_True, 0, nFlags, &pDestBufPtr, pDestBufEnd,
205*b1cdbd2cSJim Jagielski &nInfo))
206*b1cdbd2cSJim Jagielski {
207*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
208*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
209*b1cdbd2cSJim Jagielski break;
210*b1cdbd2cSJim Jagielski
211*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
212*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
213*b1cdbd2cSJim Jagielski continue;
214*b1cdbd2cSJim Jagielski
215*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
216*b1cdbd2cSJim Jagielski goto no_output;
217*b1cdbd2cSJim Jagielski }
218*b1cdbd2cSJim Jagielski break;
219*b1cdbd2cSJim Jagielski
220*b1cdbd2cSJim Jagielski no_output:
221*b1cdbd2cSJim Jagielski --pSrcBuf;
222*b1cdbd2cSJim Jagielski nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
223*b1cdbd2cSJim Jagielski break;
224*b1cdbd2cSJim Jagielski }
225*b1cdbd2cSJim Jagielski
226*b1cdbd2cSJim Jagielski if (eState > IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001
227*b1cdbd2cSJim Jagielski && (nInfo & (RTL_TEXTTOUNICODE_INFO_ERROR
228*b1cdbd2cSJim Jagielski | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL))
229*b1cdbd2cSJim Jagielski == 0)
230*b1cdbd2cSJim Jagielski {
231*b1cdbd2cSJim Jagielski if ((nFlags & RTL_TEXTTOUNICODE_FLAGS_FLUSH) == 0)
232*b1cdbd2cSJim Jagielski nInfo |= RTL_TEXTTOUNICODE_INFO_SRCBUFFERTOSMALL;
233*b1cdbd2cSJim Jagielski else
234*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputTextToUnicodeConversion(
235*b1cdbd2cSJim Jagielski sal_False, sal_True, 0, nFlags, &pDestBufPtr, pDestBufEnd,
236*b1cdbd2cSJim Jagielski &nInfo))
237*b1cdbd2cSJim Jagielski {
238*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
239*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
240*b1cdbd2cSJim Jagielski eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
241*b1cdbd2cSJim Jagielski break;
242*b1cdbd2cSJim Jagielski
243*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
244*b1cdbd2cSJim Jagielski nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
245*b1cdbd2cSJim Jagielski break;
246*b1cdbd2cSJim Jagielski }
247*b1cdbd2cSJim Jagielski }
248*b1cdbd2cSJim Jagielski
249*b1cdbd2cSJim Jagielski if (pContext)
250*b1cdbd2cSJim Jagielski {
251*b1cdbd2cSJim Jagielski ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState = eState;
252*b1cdbd2cSJim Jagielski ((ImplIso2022KrToUnicodeContext *) pContext)->m_nRow = nRow;
253*b1cdbd2cSJim Jagielski }
254*b1cdbd2cSJim Jagielski if (pInfo)
255*b1cdbd2cSJim Jagielski *pInfo = nInfo;
256*b1cdbd2cSJim Jagielski if (pSrcCvtBytes)
257*b1cdbd2cSJim Jagielski *pSrcCvtBytes = nConverted;
258*b1cdbd2cSJim Jagielski
259*b1cdbd2cSJim Jagielski return pDestBufPtr - pDestBuf;
260*b1cdbd2cSJim Jagielski }
261*b1cdbd2cSJim Jagielski
ImplCreateUnicodeToIso2022KrContext(void)262*b1cdbd2cSJim Jagielski void * ImplCreateUnicodeToIso2022KrContext(void)
263*b1cdbd2cSJim Jagielski {
264*b1cdbd2cSJim Jagielski void * pContext
265*b1cdbd2cSJim Jagielski = rtl_allocateMemory(sizeof (ImplUnicodeToIso2022KrContext));
266*b1cdbd2cSJim Jagielski ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate = 0;
267*b1cdbd2cSJim Jagielski ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet
268*b1cdbd2cSJim Jagielski = IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE;
269*b1cdbd2cSJim Jagielski return pContext;
270*b1cdbd2cSJim Jagielski }
271*b1cdbd2cSJim Jagielski
ImplResetUnicodeToIso2022KrContext(void * pContext)272*b1cdbd2cSJim Jagielski void ImplResetUnicodeToIso2022KrContext(void * pContext)
273*b1cdbd2cSJim Jagielski {
274*b1cdbd2cSJim Jagielski if (pContext)
275*b1cdbd2cSJim Jagielski {
276*b1cdbd2cSJim Jagielski ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate = 0;
277*b1cdbd2cSJim Jagielski ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet
278*b1cdbd2cSJim Jagielski = IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE;
279*b1cdbd2cSJim Jagielski }
280*b1cdbd2cSJim Jagielski }
281*b1cdbd2cSJim Jagielski
ImplConvertUnicodeToIso2022Kr(ImplTextConverterData const * pData,void * pContext,sal_Unicode const * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)282*b1cdbd2cSJim Jagielski sal_Size ImplConvertUnicodeToIso2022Kr(ImplTextConverterData const * pData,
283*b1cdbd2cSJim Jagielski void * pContext,
284*b1cdbd2cSJim Jagielski sal_Unicode const * pSrcBuf,
285*b1cdbd2cSJim Jagielski sal_Size nSrcChars,
286*b1cdbd2cSJim Jagielski sal_Char * pDestBuf,
287*b1cdbd2cSJim Jagielski sal_Size nDestBytes,
288*b1cdbd2cSJim Jagielski sal_uInt32 nFlags,
289*b1cdbd2cSJim Jagielski sal_uInt32 * pInfo,
290*b1cdbd2cSJim Jagielski sal_Size * pSrcCvtChars)
291*b1cdbd2cSJim Jagielski {
292*b1cdbd2cSJim Jagielski ImplUniToDBCSHighTab const * pKsX1001Data
293*b1cdbd2cSJim Jagielski = ((ImplIso2022KrConverterData const *) pData)->
294*b1cdbd2cSJim Jagielski m_pUnicodeToKsX1001Data;
295*b1cdbd2cSJim Jagielski sal_Unicode nHighSurrogate = 0;
296*b1cdbd2cSJim Jagielski ImplUnicodeToIso2022KrSet eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE;
297*b1cdbd2cSJim Jagielski sal_uInt32 nInfo = 0;
298*b1cdbd2cSJim Jagielski sal_Size nConverted = 0;
299*b1cdbd2cSJim Jagielski sal_Char * pDestBufPtr = pDestBuf;
300*b1cdbd2cSJim Jagielski sal_Char * pDestBufEnd = pDestBuf + nDestBytes;
301*b1cdbd2cSJim Jagielski sal_Bool bWritten;
302*b1cdbd2cSJim Jagielski
303*b1cdbd2cSJim Jagielski if (pContext)
304*b1cdbd2cSJim Jagielski {
305*b1cdbd2cSJim Jagielski nHighSurrogate
306*b1cdbd2cSJim Jagielski = ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate;
307*b1cdbd2cSJim Jagielski eSet = ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet;
308*b1cdbd2cSJim Jagielski }
309*b1cdbd2cSJim Jagielski
310*b1cdbd2cSJim Jagielski if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE)
311*b1cdbd2cSJim Jagielski {
312*b1cdbd2cSJim Jagielski if (pDestBufEnd - pDestBufPtr >= 4)
313*b1cdbd2cSJim Jagielski {
314*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x1B; /* ESC */
315*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x24; /* $ */
316*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x29; /* ) */
317*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x43; /* C */
318*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
319*b1cdbd2cSJim Jagielski }
320*b1cdbd2cSJim Jagielski else
321*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
322*b1cdbd2cSJim Jagielski }
323*b1cdbd2cSJim Jagielski
324*b1cdbd2cSJim Jagielski if ((nInfo & RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL) == 0)
325*b1cdbd2cSJim Jagielski for (; nConverted < nSrcChars; ++nConverted)
326*b1cdbd2cSJim Jagielski {
327*b1cdbd2cSJim Jagielski sal_Bool bUndefined = sal_True;
328*b1cdbd2cSJim Jagielski sal_uInt32 nChar = *pSrcBuf++;
329*b1cdbd2cSJim Jagielski if (nHighSurrogate == 0)
330*b1cdbd2cSJim Jagielski {
331*b1cdbd2cSJim Jagielski if (ImplIsHighSurrogate(nChar))
332*b1cdbd2cSJim Jagielski {
333*b1cdbd2cSJim Jagielski nHighSurrogate = (sal_Unicode) nChar;
334*b1cdbd2cSJim Jagielski continue;
335*b1cdbd2cSJim Jagielski }
336*b1cdbd2cSJim Jagielski }
337*b1cdbd2cSJim Jagielski else if (ImplIsLowSurrogate(nChar))
338*b1cdbd2cSJim Jagielski nChar = ImplCombineSurrogates(nHighSurrogate, nChar);
339*b1cdbd2cSJim Jagielski else
340*b1cdbd2cSJim Jagielski {
341*b1cdbd2cSJim Jagielski bUndefined = sal_False;
342*b1cdbd2cSJim Jagielski goto bad_input;
343*b1cdbd2cSJim Jagielski }
344*b1cdbd2cSJim Jagielski
345*b1cdbd2cSJim Jagielski if (ImplIsLowSurrogate(nChar) || ImplIsNoncharacter(nChar))
346*b1cdbd2cSJim Jagielski {
347*b1cdbd2cSJim Jagielski bUndefined = sal_False;
348*b1cdbd2cSJim Jagielski goto bad_input;
349*b1cdbd2cSJim Jagielski }
350*b1cdbd2cSJim Jagielski
351*b1cdbd2cSJim Jagielski if (nChar == 0x0A || nChar == 0x0D) /* LF, CR */
352*b1cdbd2cSJim Jagielski {
353*b1cdbd2cSJim Jagielski if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_1001)
354*b1cdbd2cSJim Jagielski {
355*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
356*b1cdbd2cSJim Jagielski {
357*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x0F; /* SI */
358*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
359*b1cdbd2cSJim Jagielski }
360*b1cdbd2cSJim Jagielski else
361*b1cdbd2cSJim Jagielski goto no_output;
362*b1cdbd2cSJim Jagielski }
363*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
364*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) nChar;
365*b1cdbd2cSJim Jagielski else
366*b1cdbd2cSJim Jagielski goto no_output;
367*b1cdbd2cSJim Jagielski }
368*b1cdbd2cSJim Jagielski else if (nChar == 0x0E || nChar == 0x0F || nChar == 0x1B)
369*b1cdbd2cSJim Jagielski goto bad_input;
370*b1cdbd2cSJim Jagielski else if (nChar < 0x80)
371*b1cdbd2cSJim Jagielski {
372*b1cdbd2cSJim Jagielski if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_1001)
373*b1cdbd2cSJim Jagielski {
374*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
375*b1cdbd2cSJim Jagielski {
376*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x0F; /* SI */
377*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
378*b1cdbd2cSJim Jagielski }
379*b1cdbd2cSJim Jagielski else
380*b1cdbd2cSJim Jagielski goto no_output;
381*b1cdbd2cSJim Jagielski }
382*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
383*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) nChar;
384*b1cdbd2cSJim Jagielski else
385*b1cdbd2cSJim Jagielski goto no_output;
386*b1cdbd2cSJim Jagielski }
387*b1cdbd2cSJim Jagielski else
388*b1cdbd2cSJim Jagielski {
389*b1cdbd2cSJim Jagielski sal_uInt16 nBytes = 0;
390*b1cdbd2cSJim Jagielski sal_uInt32 nIndex1 = nChar >> 8;
391*b1cdbd2cSJim Jagielski if (nIndex1 < 0x100)
392*b1cdbd2cSJim Jagielski {
393*b1cdbd2cSJim Jagielski sal_uInt32 nIndex2 = nChar & 0xFF;
394*b1cdbd2cSJim Jagielski sal_uInt32 nFirst = pKsX1001Data[nIndex1].mnLowStart;
395*b1cdbd2cSJim Jagielski if (nIndex2 >= nFirst
396*b1cdbd2cSJim Jagielski && nIndex2 <= pKsX1001Data[nIndex1].mnLowEnd)
397*b1cdbd2cSJim Jagielski nBytes = pKsX1001Data[nIndex1].
398*b1cdbd2cSJim Jagielski mpToUniTrailTab[nIndex2 - nFirst];
399*b1cdbd2cSJim Jagielski }
400*b1cdbd2cSJim Jagielski if (nBytes != 0)
401*b1cdbd2cSJim Jagielski {
402*b1cdbd2cSJim Jagielski if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII)
403*b1cdbd2cSJim Jagielski {
404*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
405*b1cdbd2cSJim Jagielski {
406*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x0E; /* SO */
407*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_1001;
408*b1cdbd2cSJim Jagielski }
409*b1cdbd2cSJim Jagielski else
410*b1cdbd2cSJim Jagielski goto no_output;
411*b1cdbd2cSJim Jagielski }
412*b1cdbd2cSJim Jagielski if (pDestBufEnd - pDestBufPtr >= 2)
413*b1cdbd2cSJim Jagielski {
414*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) ((nBytes >> 8) & 0x7F);
415*b1cdbd2cSJim Jagielski *pDestBufPtr++ = (sal_Char) (nBytes & 0x7F);
416*b1cdbd2cSJim Jagielski }
417*b1cdbd2cSJim Jagielski else
418*b1cdbd2cSJim Jagielski goto no_output;
419*b1cdbd2cSJim Jagielski }
420*b1cdbd2cSJim Jagielski else
421*b1cdbd2cSJim Jagielski goto bad_input;
422*b1cdbd2cSJim Jagielski }
423*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
424*b1cdbd2cSJim Jagielski continue;
425*b1cdbd2cSJim Jagielski
426*b1cdbd2cSJim Jagielski bad_input:
427*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputUnicodeToTextConversion(
428*b1cdbd2cSJim Jagielski bUndefined,
429*b1cdbd2cSJim Jagielski nChar,
430*b1cdbd2cSJim Jagielski nFlags,
431*b1cdbd2cSJim Jagielski &pDestBufPtr,
432*b1cdbd2cSJim Jagielski pDestBufEnd,
433*b1cdbd2cSJim Jagielski &nInfo,
434*b1cdbd2cSJim Jagielski "\x0F", /* SI */
435*b1cdbd2cSJim Jagielski eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII ? 0 : 1,
436*b1cdbd2cSJim Jagielski &bWritten))
437*b1cdbd2cSJim Jagielski {
438*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
439*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
440*b1cdbd2cSJim Jagielski break;
441*b1cdbd2cSJim Jagielski
442*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
443*b1cdbd2cSJim Jagielski if (bWritten)
444*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
445*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
446*b1cdbd2cSJim Jagielski continue;
447*b1cdbd2cSJim Jagielski
448*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
449*b1cdbd2cSJim Jagielski goto no_output;
450*b1cdbd2cSJim Jagielski }
451*b1cdbd2cSJim Jagielski break;
452*b1cdbd2cSJim Jagielski
453*b1cdbd2cSJim Jagielski no_output:
454*b1cdbd2cSJim Jagielski --pSrcBuf;
455*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
456*b1cdbd2cSJim Jagielski break;
457*b1cdbd2cSJim Jagielski }
458*b1cdbd2cSJim Jagielski
459*b1cdbd2cSJim Jagielski if ((nInfo & (RTL_UNICODETOTEXT_INFO_ERROR
460*b1cdbd2cSJim Jagielski | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL))
461*b1cdbd2cSJim Jagielski == 0)
462*b1cdbd2cSJim Jagielski {
463*b1cdbd2cSJim Jagielski sal_Bool bFlush = sal_True;
464*b1cdbd2cSJim Jagielski if (nHighSurrogate != 0)
465*b1cdbd2cSJim Jagielski {
466*b1cdbd2cSJim Jagielski if ((nFlags & RTL_UNICODETOTEXT_FLAGS_FLUSH) != 0)
467*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_SRCBUFFERTOSMALL;
468*b1cdbd2cSJim Jagielski else
469*b1cdbd2cSJim Jagielski switch (ImplHandleBadInputUnicodeToTextConversion(
470*b1cdbd2cSJim Jagielski sal_False,
471*b1cdbd2cSJim Jagielski 0,
472*b1cdbd2cSJim Jagielski nFlags,
473*b1cdbd2cSJim Jagielski &pDestBufPtr,
474*b1cdbd2cSJim Jagielski pDestBufEnd,
475*b1cdbd2cSJim Jagielski &nInfo,
476*b1cdbd2cSJim Jagielski "\x0F", /* SI */
477*b1cdbd2cSJim Jagielski eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII ?
478*b1cdbd2cSJim Jagielski 0 : 1,
479*b1cdbd2cSJim Jagielski &bWritten))
480*b1cdbd2cSJim Jagielski {
481*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_STOP:
482*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
483*b1cdbd2cSJim Jagielski bFlush = sal_False;
484*b1cdbd2cSJim Jagielski break;
485*b1cdbd2cSJim Jagielski
486*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_CONTINUE:
487*b1cdbd2cSJim Jagielski if (bWritten)
488*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
489*b1cdbd2cSJim Jagielski nHighSurrogate = 0;
490*b1cdbd2cSJim Jagielski break;
491*b1cdbd2cSJim Jagielski
492*b1cdbd2cSJim Jagielski case IMPL_BAD_INPUT_NO_OUTPUT:
493*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
494*b1cdbd2cSJim Jagielski break;
495*b1cdbd2cSJim Jagielski }
496*b1cdbd2cSJim Jagielski }
497*b1cdbd2cSJim Jagielski if (bFlush
498*b1cdbd2cSJim Jagielski && eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_1001
499*b1cdbd2cSJim Jagielski && (nFlags & RTL_UNICODETOTEXT_FLAGS_FLUSH) != 0)
500*b1cdbd2cSJim Jagielski {
501*b1cdbd2cSJim Jagielski if (pDestBufPtr != pDestBufEnd)
502*b1cdbd2cSJim Jagielski {
503*b1cdbd2cSJim Jagielski *pDestBufPtr++ = 0x0F; /* SI */
504*b1cdbd2cSJim Jagielski eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
505*b1cdbd2cSJim Jagielski }
506*b1cdbd2cSJim Jagielski else
507*b1cdbd2cSJim Jagielski nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
508*b1cdbd2cSJim Jagielski }
509*b1cdbd2cSJim Jagielski }
510*b1cdbd2cSJim Jagielski
511*b1cdbd2cSJim Jagielski if (pContext)
512*b1cdbd2cSJim Jagielski {
513*b1cdbd2cSJim Jagielski ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate
514*b1cdbd2cSJim Jagielski = nHighSurrogate;
515*b1cdbd2cSJim Jagielski ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet = eSet;
516*b1cdbd2cSJim Jagielski }
517*b1cdbd2cSJim Jagielski if (pInfo)
518*b1cdbd2cSJim Jagielski *pInfo = nInfo;
519*b1cdbd2cSJim Jagielski if (pSrcCvtChars)
520*b1cdbd2cSJim Jagielski *pSrcCvtChars = nConverted;
521*b1cdbd2cSJim Jagielski
522*b1cdbd2cSJim Jagielski return pDestBufPtr - pDestBuf;
523*b1cdbd2cSJim Jagielski }
524