xref: /aoo4110/main/sal/textenc/convertiso2022kr.c (revision b1cdbd2c)
1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski #include "convertiso2022kr.h"
25*b1cdbd2cSJim Jagielski #include "context.h"
26*b1cdbd2cSJim Jagielski #include "converter.h"
27*b1cdbd2cSJim Jagielski #include "tenchelp.h"
28*b1cdbd2cSJim Jagielski #include "unichars.h"
29*b1cdbd2cSJim Jagielski #include "rtl/alloc.h"
30*b1cdbd2cSJim Jagielski #include "rtl/textcvt.h"
31*b1cdbd2cSJim Jagielski #include "sal/types.h"
32*b1cdbd2cSJim Jagielski 
33*b1cdbd2cSJim Jagielski typedef enum /* order is important: */
34*b1cdbd2cSJim Jagielski {
35*b1cdbd2cSJim Jagielski     IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII,
36*b1cdbd2cSJim Jagielski     IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001,
37*b1cdbd2cSJim Jagielski     IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001_2,
38*b1cdbd2cSJim Jagielski     IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC,
39*b1cdbd2cSJim Jagielski     IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR,
40*b1cdbd2cSJim Jagielski     IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR_RPAREN
41*b1cdbd2cSJim Jagielski } ImplIso2022KrToUnicodeState;
42*b1cdbd2cSJim Jagielski 
43*b1cdbd2cSJim Jagielski typedef struct
44*b1cdbd2cSJim Jagielski {
45*b1cdbd2cSJim Jagielski     ImplIso2022KrToUnicodeState m_eState;
46*b1cdbd2cSJim Jagielski     sal_uInt32 m_nRow;
47*b1cdbd2cSJim Jagielski } ImplIso2022KrToUnicodeContext;
48*b1cdbd2cSJim Jagielski 
49*b1cdbd2cSJim Jagielski typedef enum
50*b1cdbd2cSJim Jagielski {
51*b1cdbd2cSJim Jagielski     IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE,
52*b1cdbd2cSJim Jagielski     IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII,
53*b1cdbd2cSJim Jagielski     IMPL_UNICODE_TO_ISO_2022_KR_SET_1001
54*b1cdbd2cSJim Jagielski } ImplUnicodeToIso2022KrSet;
55*b1cdbd2cSJim Jagielski 
56*b1cdbd2cSJim Jagielski typedef struct
57*b1cdbd2cSJim Jagielski {
58*b1cdbd2cSJim Jagielski     sal_Unicode m_nHighSurrogate;
59*b1cdbd2cSJim Jagielski     ImplUnicodeToIso2022KrSet m_eSet;
60*b1cdbd2cSJim Jagielski } ImplUnicodeToIso2022KrContext;
61*b1cdbd2cSJim Jagielski 
ImplCreateIso2022KrToUnicodeContext(void)62*b1cdbd2cSJim Jagielski void * ImplCreateIso2022KrToUnicodeContext(void)
63*b1cdbd2cSJim Jagielski {
64*b1cdbd2cSJim Jagielski     void * pContext
65*b1cdbd2cSJim Jagielski         = rtl_allocateMemory(sizeof (ImplIso2022KrToUnicodeContext));
66*b1cdbd2cSJim Jagielski     ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState
67*b1cdbd2cSJim Jagielski         = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
68*b1cdbd2cSJim Jagielski     return pContext;
69*b1cdbd2cSJim Jagielski }
70*b1cdbd2cSJim Jagielski 
ImplResetIso2022KrToUnicodeContext(void * pContext)71*b1cdbd2cSJim Jagielski void ImplResetIso2022KrToUnicodeContext(void * pContext)
72*b1cdbd2cSJim Jagielski {
73*b1cdbd2cSJim Jagielski     if (pContext)
74*b1cdbd2cSJim Jagielski         ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState
75*b1cdbd2cSJim Jagielski             = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
76*b1cdbd2cSJim Jagielski }
77*b1cdbd2cSJim Jagielski 
ImplConvertIso2022KrToUnicode(ImplTextConverterData const * pData,void * pContext,sal_Char const * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)78*b1cdbd2cSJim Jagielski sal_Size ImplConvertIso2022KrToUnicode(ImplTextConverterData const * pData,
79*b1cdbd2cSJim Jagielski                                        void * pContext,
80*b1cdbd2cSJim Jagielski                                        sal_Char const * pSrcBuf,
81*b1cdbd2cSJim Jagielski                                        sal_Size nSrcBytes,
82*b1cdbd2cSJim Jagielski                                        sal_Unicode * pDestBuf,
83*b1cdbd2cSJim Jagielski                                        sal_Size nDestChars,
84*b1cdbd2cSJim Jagielski                                        sal_uInt32 nFlags,
85*b1cdbd2cSJim Jagielski                                        sal_uInt32 * pInfo,
86*b1cdbd2cSJim Jagielski                                        sal_Size * pSrcCvtBytes)
87*b1cdbd2cSJim Jagielski {
88*b1cdbd2cSJim Jagielski     ImplDBCSToUniLeadTab const * pKsX1001Data
89*b1cdbd2cSJim Jagielski         = ((ImplIso2022KrConverterData const *) pData)->
90*b1cdbd2cSJim Jagielski               m_pKsX1001ToUnicodeData;
91*b1cdbd2cSJim Jagielski     ImplIso2022KrToUnicodeState eState
92*b1cdbd2cSJim Jagielski         = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
93*b1cdbd2cSJim Jagielski     sal_uInt32 nRow = 0;
94*b1cdbd2cSJim Jagielski     sal_uInt32 nInfo = 0;
95*b1cdbd2cSJim Jagielski     sal_Size nConverted = 0;
96*b1cdbd2cSJim Jagielski     sal_Unicode * pDestBufPtr = pDestBuf;
97*b1cdbd2cSJim Jagielski     sal_Unicode * pDestBufEnd = pDestBuf + nDestChars;
98*b1cdbd2cSJim Jagielski 
99*b1cdbd2cSJim Jagielski     if (pContext)
100*b1cdbd2cSJim Jagielski     {
101*b1cdbd2cSJim Jagielski         eState = ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState;
102*b1cdbd2cSJim Jagielski         nRow = ((ImplIso2022KrToUnicodeContext *) pContext)->m_nRow;
103*b1cdbd2cSJim Jagielski     }
104*b1cdbd2cSJim Jagielski 
105*b1cdbd2cSJim Jagielski     for (; nConverted < nSrcBytes; ++nConverted)
106*b1cdbd2cSJim Jagielski     {
107*b1cdbd2cSJim Jagielski         sal_Bool bUndefined = sal_True;
108*b1cdbd2cSJim Jagielski         sal_uInt32 nChar = *(sal_uChar const *) pSrcBuf++;
109*b1cdbd2cSJim Jagielski         switch (eState)
110*b1cdbd2cSJim Jagielski         {
111*b1cdbd2cSJim Jagielski         case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII:
112*b1cdbd2cSJim Jagielski             if (nChar == 0x0E) /* SO */
113*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001;
114*b1cdbd2cSJim Jagielski             else if (nChar == 0x1B) /* ESC */
115*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC;
116*b1cdbd2cSJim Jagielski             else if (nChar < 0x80)
117*b1cdbd2cSJim Jagielski                 if (pDestBufPtr != pDestBufEnd)
118*b1cdbd2cSJim Jagielski                     *pDestBufPtr++ = (sal_Unicode) nChar;
119*b1cdbd2cSJim Jagielski                 else
120*b1cdbd2cSJim Jagielski                     goto no_output;
121*b1cdbd2cSJim Jagielski             else
122*b1cdbd2cSJim Jagielski             {
123*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
124*b1cdbd2cSJim Jagielski                 goto bad_input;
125*b1cdbd2cSJim Jagielski             }
126*b1cdbd2cSJim Jagielski             break;
127*b1cdbd2cSJim Jagielski 
128*b1cdbd2cSJim Jagielski         case IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001:
129*b1cdbd2cSJim Jagielski             if (nChar == 0x0F) /* SI */
130*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
131*b1cdbd2cSJim Jagielski             else if (nChar >= 0x21 && nChar <= 0x7E)
132*b1cdbd2cSJim Jagielski             {
133*b1cdbd2cSJim Jagielski                 nRow = nChar + 0x80;
134*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001_2;
135*b1cdbd2cSJim Jagielski             }
136*b1cdbd2cSJim Jagielski             else
137*b1cdbd2cSJim Jagielski             {
138*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
139*b1cdbd2cSJim Jagielski                 goto bad_input;
140*b1cdbd2cSJim Jagielski             }
141*b1cdbd2cSJim Jagielski             break;
142*b1cdbd2cSJim Jagielski 
143*b1cdbd2cSJim Jagielski         case IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001_2:
144*b1cdbd2cSJim Jagielski             if (nChar >= 0x21 && nChar <= 0x7E)
145*b1cdbd2cSJim Jagielski             {
146*b1cdbd2cSJim Jagielski                 sal_uInt16 nUnicode = 0;
147*b1cdbd2cSJim Jagielski                 sal_uInt32 nFirst = pKsX1001Data[nRow].mnTrailStart;
148*b1cdbd2cSJim Jagielski                 nChar += 0x80;
149*b1cdbd2cSJim Jagielski                 if (nChar >= nFirst && nChar <= pKsX1001Data[nRow].mnTrailEnd)
150*b1cdbd2cSJim Jagielski                     nUnicode = pKsX1001Data[nRow].
151*b1cdbd2cSJim Jagielski                                    mpToUniTrailTab[nChar - nFirst];
152*b1cdbd2cSJim Jagielski                 if (nUnicode != 0)
153*b1cdbd2cSJim Jagielski                     if (pDestBufPtr != pDestBufEnd)
154*b1cdbd2cSJim Jagielski                     {
155*b1cdbd2cSJim Jagielski                         *pDestBufPtr++ = (sal_Unicode) nUnicode;
156*b1cdbd2cSJim Jagielski                         eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001;
157*b1cdbd2cSJim Jagielski                     }
158*b1cdbd2cSJim Jagielski                     else
159*b1cdbd2cSJim Jagielski                         goto no_output;
160*b1cdbd2cSJim Jagielski                 else
161*b1cdbd2cSJim Jagielski                     goto bad_input;
162*b1cdbd2cSJim Jagielski             }
163*b1cdbd2cSJim Jagielski             else
164*b1cdbd2cSJim Jagielski             {
165*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
166*b1cdbd2cSJim Jagielski                 goto bad_input;
167*b1cdbd2cSJim Jagielski             }
168*b1cdbd2cSJim Jagielski             break;
169*b1cdbd2cSJim Jagielski 
170*b1cdbd2cSJim Jagielski         case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC:
171*b1cdbd2cSJim Jagielski             if (nChar == 0x24) /* $ */
172*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR;
173*b1cdbd2cSJim Jagielski             else
174*b1cdbd2cSJim Jagielski             {
175*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
176*b1cdbd2cSJim Jagielski                 goto bad_input;
177*b1cdbd2cSJim Jagielski             }
178*b1cdbd2cSJim Jagielski             break;
179*b1cdbd2cSJim Jagielski 
180*b1cdbd2cSJim Jagielski         case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR:
181*b1cdbd2cSJim Jagielski             if (nChar == 0x29) /* ) */
182*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR_RPAREN;
183*b1cdbd2cSJim Jagielski             else
184*b1cdbd2cSJim Jagielski             {
185*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
186*b1cdbd2cSJim Jagielski                 goto bad_input;
187*b1cdbd2cSJim Jagielski             }
188*b1cdbd2cSJim Jagielski             break;
189*b1cdbd2cSJim Jagielski 
190*b1cdbd2cSJim Jagielski         case IMPL_ISO_2022_KR_TO_UNICODE_STATE_ESC_DOLLAR_RPAREN:
191*b1cdbd2cSJim Jagielski             if (nChar == 0x43) /* C */
192*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
193*b1cdbd2cSJim Jagielski             else
194*b1cdbd2cSJim Jagielski             {
195*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
196*b1cdbd2cSJim Jagielski                 goto bad_input;
197*b1cdbd2cSJim Jagielski             }
198*b1cdbd2cSJim Jagielski             break;
199*b1cdbd2cSJim Jagielski         }
200*b1cdbd2cSJim Jagielski         continue;
201*b1cdbd2cSJim Jagielski 
202*b1cdbd2cSJim Jagielski     bad_input:
203*b1cdbd2cSJim Jagielski         switch (ImplHandleBadInputTextToUnicodeConversion(
204*b1cdbd2cSJim Jagielski                     bUndefined, sal_True, 0, nFlags, &pDestBufPtr, pDestBufEnd,
205*b1cdbd2cSJim Jagielski                     &nInfo))
206*b1cdbd2cSJim Jagielski         {
207*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_STOP:
208*b1cdbd2cSJim Jagielski             eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
209*b1cdbd2cSJim Jagielski             break;
210*b1cdbd2cSJim Jagielski 
211*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_CONTINUE:
212*b1cdbd2cSJim Jagielski             eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
213*b1cdbd2cSJim Jagielski             continue;
214*b1cdbd2cSJim Jagielski 
215*b1cdbd2cSJim Jagielski         case IMPL_BAD_INPUT_NO_OUTPUT:
216*b1cdbd2cSJim Jagielski             goto no_output;
217*b1cdbd2cSJim Jagielski         }
218*b1cdbd2cSJim Jagielski         break;
219*b1cdbd2cSJim Jagielski 
220*b1cdbd2cSJim Jagielski     no_output:
221*b1cdbd2cSJim Jagielski         --pSrcBuf;
222*b1cdbd2cSJim Jagielski         nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
223*b1cdbd2cSJim Jagielski         break;
224*b1cdbd2cSJim Jagielski     }
225*b1cdbd2cSJim Jagielski 
226*b1cdbd2cSJim Jagielski     if (eState > IMPL_ISO_2022_KR_TO_UNICODE_STATE_1001
227*b1cdbd2cSJim Jagielski         && (nInfo & (RTL_TEXTTOUNICODE_INFO_ERROR
228*b1cdbd2cSJim Jagielski                          | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL))
229*b1cdbd2cSJim Jagielski                == 0)
230*b1cdbd2cSJim Jagielski     {
231*b1cdbd2cSJim Jagielski         if ((nFlags & RTL_TEXTTOUNICODE_FLAGS_FLUSH) == 0)
232*b1cdbd2cSJim Jagielski             nInfo |= RTL_TEXTTOUNICODE_INFO_SRCBUFFERTOSMALL;
233*b1cdbd2cSJim Jagielski         else
234*b1cdbd2cSJim Jagielski             switch (ImplHandleBadInputTextToUnicodeConversion(
235*b1cdbd2cSJim Jagielski                         sal_False, sal_True, 0, nFlags, &pDestBufPtr, pDestBufEnd,
236*b1cdbd2cSJim Jagielski                         &nInfo))
237*b1cdbd2cSJim Jagielski             {
238*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_STOP:
239*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_CONTINUE:
240*b1cdbd2cSJim Jagielski                 eState = IMPL_ISO_2022_KR_TO_UNICODE_STATE_ASCII;
241*b1cdbd2cSJim Jagielski                 break;
242*b1cdbd2cSJim Jagielski 
243*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_NO_OUTPUT:
244*b1cdbd2cSJim Jagielski                 nInfo |= RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
245*b1cdbd2cSJim Jagielski                 break;
246*b1cdbd2cSJim Jagielski             }
247*b1cdbd2cSJim Jagielski     }
248*b1cdbd2cSJim Jagielski 
249*b1cdbd2cSJim Jagielski     if (pContext)
250*b1cdbd2cSJim Jagielski     {
251*b1cdbd2cSJim Jagielski         ((ImplIso2022KrToUnicodeContext *) pContext)->m_eState = eState;
252*b1cdbd2cSJim Jagielski         ((ImplIso2022KrToUnicodeContext *) pContext)->m_nRow = nRow;
253*b1cdbd2cSJim Jagielski     }
254*b1cdbd2cSJim Jagielski     if (pInfo)
255*b1cdbd2cSJim Jagielski         *pInfo = nInfo;
256*b1cdbd2cSJim Jagielski     if (pSrcCvtBytes)
257*b1cdbd2cSJim Jagielski         *pSrcCvtBytes = nConverted;
258*b1cdbd2cSJim Jagielski 
259*b1cdbd2cSJim Jagielski     return pDestBufPtr - pDestBuf;
260*b1cdbd2cSJim Jagielski }
261*b1cdbd2cSJim Jagielski 
ImplCreateUnicodeToIso2022KrContext(void)262*b1cdbd2cSJim Jagielski void * ImplCreateUnicodeToIso2022KrContext(void)
263*b1cdbd2cSJim Jagielski {
264*b1cdbd2cSJim Jagielski     void * pContext
265*b1cdbd2cSJim Jagielski         = rtl_allocateMemory(sizeof (ImplUnicodeToIso2022KrContext));
266*b1cdbd2cSJim Jagielski     ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate = 0;
267*b1cdbd2cSJim Jagielski     ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet
268*b1cdbd2cSJim Jagielski         = IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE;
269*b1cdbd2cSJim Jagielski     return pContext;
270*b1cdbd2cSJim Jagielski }
271*b1cdbd2cSJim Jagielski 
ImplResetUnicodeToIso2022KrContext(void * pContext)272*b1cdbd2cSJim Jagielski void ImplResetUnicodeToIso2022KrContext(void * pContext)
273*b1cdbd2cSJim Jagielski {
274*b1cdbd2cSJim Jagielski     if (pContext)
275*b1cdbd2cSJim Jagielski     {
276*b1cdbd2cSJim Jagielski         ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate = 0;
277*b1cdbd2cSJim Jagielski         ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet
278*b1cdbd2cSJim Jagielski             = IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE;
279*b1cdbd2cSJim Jagielski     }
280*b1cdbd2cSJim Jagielski }
281*b1cdbd2cSJim Jagielski 
ImplConvertUnicodeToIso2022Kr(ImplTextConverterData const * pData,void * pContext,sal_Unicode const * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)282*b1cdbd2cSJim Jagielski sal_Size ImplConvertUnicodeToIso2022Kr(ImplTextConverterData const * pData,
283*b1cdbd2cSJim Jagielski                                        void * pContext,
284*b1cdbd2cSJim Jagielski                                        sal_Unicode const * pSrcBuf,
285*b1cdbd2cSJim Jagielski                                        sal_Size nSrcChars,
286*b1cdbd2cSJim Jagielski                                        sal_Char * pDestBuf,
287*b1cdbd2cSJim Jagielski                                        sal_Size nDestBytes,
288*b1cdbd2cSJim Jagielski                                        sal_uInt32 nFlags,
289*b1cdbd2cSJim Jagielski                                        sal_uInt32 * pInfo,
290*b1cdbd2cSJim Jagielski                                        sal_Size * pSrcCvtChars)
291*b1cdbd2cSJim Jagielski {
292*b1cdbd2cSJim Jagielski     ImplUniToDBCSHighTab const * pKsX1001Data
293*b1cdbd2cSJim Jagielski         = ((ImplIso2022KrConverterData const *) pData)->
294*b1cdbd2cSJim Jagielski               m_pUnicodeToKsX1001Data;
295*b1cdbd2cSJim Jagielski     sal_Unicode nHighSurrogate = 0;
296*b1cdbd2cSJim Jagielski     ImplUnicodeToIso2022KrSet eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE;
297*b1cdbd2cSJim Jagielski     sal_uInt32 nInfo = 0;
298*b1cdbd2cSJim Jagielski     sal_Size nConverted = 0;
299*b1cdbd2cSJim Jagielski     sal_Char * pDestBufPtr = pDestBuf;
300*b1cdbd2cSJim Jagielski     sal_Char * pDestBufEnd = pDestBuf + nDestBytes;
301*b1cdbd2cSJim Jagielski     sal_Bool bWritten;
302*b1cdbd2cSJim Jagielski 
303*b1cdbd2cSJim Jagielski     if (pContext)
304*b1cdbd2cSJim Jagielski     {
305*b1cdbd2cSJim Jagielski         nHighSurrogate
306*b1cdbd2cSJim Jagielski             = ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate;
307*b1cdbd2cSJim Jagielski         eSet = ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet;
308*b1cdbd2cSJim Jagielski     }
309*b1cdbd2cSJim Jagielski 
310*b1cdbd2cSJim Jagielski     if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_NONE)
311*b1cdbd2cSJim Jagielski     {
312*b1cdbd2cSJim Jagielski         if (pDestBufEnd - pDestBufPtr >= 4)
313*b1cdbd2cSJim Jagielski         {
314*b1cdbd2cSJim Jagielski             *pDestBufPtr++ = 0x1B; /* ESC */
315*b1cdbd2cSJim Jagielski             *pDestBufPtr++ = 0x24; /* $ */
316*b1cdbd2cSJim Jagielski             *pDestBufPtr++ = 0x29; /* ) */
317*b1cdbd2cSJim Jagielski             *pDestBufPtr++ = 0x43; /* C */
318*b1cdbd2cSJim Jagielski             eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
319*b1cdbd2cSJim Jagielski         }
320*b1cdbd2cSJim Jagielski         else
321*b1cdbd2cSJim Jagielski             nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
322*b1cdbd2cSJim Jagielski     }
323*b1cdbd2cSJim Jagielski 
324*b1cdbd2cSJim Jagielski     if ((nInfo & RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL) == 0)
325*b1cdbd2cSJim Jagielski         for (; nConverted < nSrcChars; ++nConverted)
326*b1cdbd2cSJim Jagielski         {
327*b1cdbd2cSJim Jagielski             sal_Bool bUndefined = sal_True;
328*b1cdbd2cSJim Jagielski             sal_uInt32 nChar = *pSrcBuf++;
329*b1cdbd2cSJim Jagielski             if (nHighSurrogate == 0)
330*b1cdbd2cSJim Jagielski             {
331*b1cdbd2cSJim Jagielski                 if (ImplIsHighSurrogate(nChar))
332*b1cdbd2cSJim Jagielski                 {
333*b1cdbd2cSJim Jagielski                     nHighSurrogate = (sal_Unicode) nChar;
334*b1cdbd2cSJim Jagielski                     continue;
335*b1cdbd2cSJim Jagielski                 }
336*b1cdbd2cSJim Jagielski             }
337*b1cdbd2cSJim Jagielski             else if (ImplIsLowSurrogate(nChar))
338*b1cdbd2cSJim Jagielski                 nChar = ImplCombineSurrogates(nHighSurrogate, nChar);
339*b1cdbd2cSJim Jagielski             else
340*b1cdbd2cSJim Jagielski             {
341*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
342*b1cdbd2cSJim Jagielski                 goto bad_input;
343*b1cdbd2cSJim Jagielski             }
344*b1cdbd2cSJim Jagielski 
345*b1cdbd2cSJim Jagielski             if (ImplIsLowSurrogate(nChar) || ImplIsNoncharacter(nChar))
346*b1cdbd2cSJim Jagielski             {
347*b1cdbd2cSJim Jagielski                 bUndefined = sal_False;
348*b1cdbd2cSJim Jagielski                 goto bad_input;
349*b1cdbd2cSJim Jagielski             }
350*b1cdbd2cSJim Jagielski 
351*b1cdbd2cSJim Jagielski             if (nChar == 0x0A || nChar == 0x0D) /* LF, CR */
352*b1cdbd2cSJim Jagielski             {
353*b1cdbd2cSJim Jagielski                 if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_1001)
354*b1cdbd2cSJim Jagielski                 {
355*b1cdbd2cSJim Jagielski                     if (pDestBufPtr != pDestBufEnd)
356*b1cdbd2cSJim Jagielski                     {
357*b1cdbd2cSJim Jagielski                         *pDestBufPtr++ = 0x0F; /* SI */
358*b1cdbd2cSJim Jagielski                         eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
359*b1cdbd2cSJim Jagielski                     }
360*b1cdbd2cSJim Jagielski                     else
361*b1cdbd2cSJim Jagielski                         goto no_output;
362*b1cdbd2cSJim Jagielski                 }
363*b1cdbd2cSJim Jagielski                 if (pDestBufPtr != pDestBufEnd)
364*b1cdbd2cSJim Jagielski                     *pDestBufPtr++ = (sal_Char) nChar;
365*b1cdbd2cSJim Jagielski                 else
366*b1cdbd2cSJim Jagielski                     goto no_output;
367*b1cdbd2cSJim Jagielski             }
368*b1cdbd2cSJim Jagielski             else if (nChar == 0x0E || nChar == 0x0F || nChar == 0x1B)
369*b1cdbd2cSJim Jagielski                 goto bad_input;
370*b1cdbd2cSJim Jagielski             else if (nChar < 0x80)
371*b1cdbd2cSJim Jagielski             {
372*b1cdbd2cSJim Jagielski                 if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_1001)
373*b1cdbd2cSJim Jagielski                 {
374*b1cdbd2cSJim Jagielski                     if (pDestBufPtr != pDestBufEnd)
375*b1cdbd2cSJim Jagielski                     {
376*b1cdbd2cSJim Jagielski                         *pDestBufPtr++ = 0x0F; /* SI */
377*b1cdbd2cSJim Jagielski                         eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
378*b1cdbd2cSJim Jagielski                     }
379*b1cdbd2cSJim Jagielski                     else
380*b1cdbd2cSJim Jagielski                         goto no_output;
381*b1cdbd2cSJim Jagielski                 }
382*b1cdbd2cSJim Jagielski                 if (pDestBufPtr != pDestBufEnd)
383*b1cdbd2cSJim Jagielski                     *pDestBufPtr++ = (sal_Char) nChar;
384*b1cdbd2cSJim Jagielski                 else
385*b1cdbd2cSJim Jagielski                     goto no_output;
386*b1cdbd2cSJim Jagielski             }
387*b1cdbd2cSJim Jagielski             else
388*b1cdbd2cSJim Jagielski             {
389*b1cdbd2cSJim Jagielski                 sal_uInt16 nBytes = 0;
390*b1cdbd2cSJim Jagielski                 sal_uInt32 nIndex1 = nChar >> 8;
391*b1cdbd2cSJim Jagielski                 if (nIndex1 < 0x100)
392*b1cdbd2cSJim Jagielski                 {
393*b1cdbd2cSJim Jagielski                     sal_uInt32 nIndex2 = nChar & 0xFF;
394*b1cdbd2cSJim Jagielski                     sal_uInt32 nFirst = pKsX1001Data[nIndex1].mnLowStart;
395*b1cdbd2cSJim Jagielski                     if (nIndex2 >= nFirst
396*b1cdbd2cSJim Jagielski                         && nIndex2 <= pKsX1001Data[nIndex1].mnLowEnd)
397*b1cdbd2cSJim Jagielski                         nBytes = pKsX1001Data[nIndex1].
398*b1cdbd2cSJim Jagielski                                      mpToUniTrailTab[nIndex2 - nFirst];
399*b1cdbd2cSJim Jagielski                 }
400*b1cdbd2cSJim Jagielski                 if (nBytes != 0)
401*b1cdbd2cSJim Jagielski                 {
402*b1cdbd2cSJim Jagielski                     if (eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII)
403*b1cdbd2cSJim Jagielski                     {
404*b1cdbd2cSJim Jagielski                         if (pDestBufPtr != pDestBufEnd)
405*b1cdbd2cSJim Jagielski                         {
406*b1cdbd2cSJim Jagielski                             *pDestBufPtr++ = 0x0E; /* SO */
407*b1cdbd2cSJim Jagielski                             eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_1001;
408*b1cdbd2cSJim Jagielski                         }
409*b1cdbd2cSJim Jagielski                         else
410*b1cdbd2cSJim Jagielski                             goto no_output;
411*b1cdbd2cSJim Jagielski                     }
412*b1cdbd2cSJim Jagielski                     if (pDestBufEnd - pDestBufPtr >= 2)
413*b1cdbd2cSJim Jagielski                     {
414*b1cdbd2cSJim Jagielski                         *pDestBufPtr++ = (sal_Char) ((nBytes >> 8) & 0x7F);
415*b1cdbd2cSJim Jagielski                         *pDestBufPtr++ = (sal_Char) (nBytes & 0x7F);
416*b1cdbd2cSJim Jagielski                     }
417*b1cdbd2cSJim Jagielski                     else
418*b1cdbd2cSJim Jagielski                         goto no_output;
419*b1cdbd2cSJim Jagielski                 }
420*b1cdbd2cSJim Jagielski                 else
421*b1cdbd2cSJim Jagielski                     goto bad_input;
422*b1cdbd2cSJim Jagielski             }
423*b1cdbd2cSJim Jagielski             nHighSurrogate = 0;
424*b1cdbd2cSJim Jagielski             continue;
425*b1cdbd2cSJim Jagielski 
426*b1cdbd2cSJim Jagielski         bad_input:
427*b1cdbd2cSJim Jagielski             switch (ImplHandleBadInputUnicodeToTextConversion(
428*b1cdbd2cSJim Jagielski                         bUndefined,
429*b1cdbd2cSJim Jagielski                         nChar,
430*b1cdbd2cSJim Jagielski                         nFlags,
431*b1cdbd2cSJim Jagielski                         &pDestBufPtr,
432*b1cdbd2cSJim Jagielski                         pDestBufEnd,
433*b1cdbd2cSJim Jagielski                         &nInfo,
434*b1cdbd2cSJim Jagielski                         "\x0F", /* SI */
435*b1cdbd2cSJim Jagielski                         eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII ? 0 : 1,
436*b1cdbd2cSJim Jagielski                         &bWritten))
437*b1cdbd2cSJim Jagielski             {
438*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_STOP:
439*b1cdbd2cSJim Jagielski                 nHighSurrogate = 0;
440*b1cdbd2cSJim Jagielski                 break;
441*b1cdbd2cSJim Jagielski 
442*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_CONTINUE:
443*b1cdbd2cSJim Jagielski                 if (bWritten)
444*b1cdbd2cSJim Jagielski                     eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
445*b1cdbd2cSJim Jagielski                 nHighSurrogate = 0;
446*b1cdbd2cSJim Jagielski                 continue;
447*b1cdbd2cSJim Jagielski 
448*b1cdbd2cSJim Jagielski             case IMPL_BAD_INPUT_NO_OUTPUT:
449*b1cdbd2cSJim Jagielski                 goto no_output;
450*b1cdbd2cSJim Jagielski             }
451*b1cdbd2cSJim Jagielski             break;
452*b1cdbd2cSJim Jagielski 
453*b1cdbd2cSJim Jagielski         no_output:
454*b1cdbd2cSJim Jagielski             --pSrcBuf;
455*b1cdbd2cSJim Jagielski             nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
456*b1cdbd2cSJim Jagielski             break;
457*b1cdbd2cSJim Jagielski         }
458*b1cdbd2cSJim Jagielski 
459*b1cdbd2cSJim Jagielski     if ((nInfo & (RTL_UNICODETOTEXT_INFO_ERROR
460*b1cdbd2cSJim Jagielski                       | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL))
461*b1cdbd2cSJim Jagielski             == 0)
462*b1cdbd2cSJim Jagielski     {
463*b1cdbd2cSJim Jagielski         sal_Bool bFlush = sal_True;
464*b1cdbd2cSJim Jagielski         if (nHighSurrogate != 0)
465*b1cdbd2cSJim Jagielski         {
466*b1cdbd2cSJim Jagielski             if ((nFlags & RTL_UNICODETOTEXT_FLAGS_FLUSH) != 0)
467*b1cdbd2cSJim Jagielski                 nInfo |= RTL_UNICODETOTEXT_INFO_SRCBUFFERTOSMALL;
468*b1cdbd2cSJim Jagielski             else
469*b1cdbd2cSJim Jagielski                 switch (ImplHandleBadInputUnicodeToTextConversion(
470*b1cdbd2cSJim Jagielski                             sal_False,
471*b1cdbd2cSJim Jagielski                             0,
472*b1cdbd2cSJim Jagielski                             nFlags,
473*b1cdbd2cSJim Jagielski                             &pDestBufPtr,
474*b1cdbd2cSJim Jagielski                             pDestBufEnd,
475*b1cdbd2cSJim Jagielski                             &nInfo,
476*b1cdbd2cSJim Jagielski                             "\x0F", /* SI */
477*b1cdbd2cSJim Jagielski                             eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII ?
478*b1cdbd2cSJim Jagielski                                 0 : 1,
479*b1cdbd2cSJim Jagielski                             &bWritten))
480*b1cdbd2cSJim Jagielski                 {
481*b1cdbd2cSJim Jagielski                 case IMPL_BAD_INPUT_STOP:
482*b1cdbd2cSJim Jagielski                     nHighSurrogate = 0;
483*b1cdbd2cSJim Jagielski                     bFlush = sal_False;
484*b1cdbd2cSJim Jagielski                     break;
485*b1cdbd2cSJim Jagielski 
486*b1cdbd2cSJim Jagielski                 case IMPL_BAD_INPUT_CONTINUE:
487*b1cdbd2cSJim Jagielski                     if (bWritten)
488*b1cdbd2cSJim Jagielski                         eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
489*b1cdbd2cSJim Jagielski                     nHighSurrogate = 0;
490*b1cdbd2cSJim Jagielski                     break;
491*b1cdbd2cSJim Jagielski 
492*b1cdbd2cSJim Jagielski                 case IMPL_BAD_INPUT_NO_OUTPUT:
493*b1cdbd2cSJim Jagielski                     nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
494*b1cdbd2cSJim Jagielski                     break;
495*b1cdbd2cSJim Jagielski                 }
496*b1cdbd2cSJim Jagielski         }
497*b1cdbd2cSJim Jagielski         if (bFlush
498*b1cdbd2cSJim Jagielski             && eSet == IMPL_UNICODE_TO_ISO_2022_KR_SET_1001
499*b1cdbd2cSJim Jagielski             && (nFlags & RTL_UNICODETOTEXT_FLAGS_FLUSH) != 0)
500*b1cdbd2cSJim Jagielski         {
501*b1cdbd2cSJim Jagielski             if (pDestBufPtr != pDestBufEnd)
502*b1cdbd2cSJim Jagielski             {
503*b1cdbd2cSJim Jagielski                 *pDestBufPtr++ = 0x0F; /* SI */
504*b1cdbd2cSJim Jagielski                 eSet = IMPL_UNICODE_TO_ISO_2022_KR_SET_ASCII;
505*b1cdbd2cSJim Jagielski             }
506*b1cdbd2cSJim Jagielski             else
507*b1cdbd2cSJim Jagielski                 nInfo |= RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
508*b1cdbd2cSJim Jagielski         }
509*b1cdbd2cSJim Jagielski     }
510*b1cdbd2cSJim Jagielski 
511*b1cdbd2cSJim Jagielski     if (pContext)
512*b1cdbd2cSJim Jagielski     {
513*b1cdbd2cSJim Jagielski         ((ImplUnicodeToIso2022KrContext *) pContext)->m_nHighSurrogate
514*b1cdbd2cSJim Jagielski             = nHighSurrogate;
515*b1cdbd2cSJim Jagielski         ((ImplUnicodeToIso2022KrContext *) pContext)->m_eSet = eSet;
516*b1cdbd2cSJim Jagielski     }
517*b1cdbd2cSJim Jagielski     if (pInfo)
518*b1cdbd2cSJim Jagielski         *pInfo = nInfo;
519*b1cdbd2cSJim Jagielski     if (pSrcCvtChars)
520*b1cdbd2cSJim Jagielski         *pSrcCvtChars = nConverted;
521*b1cdbd2cSJim Jagielski 
522*b1cdbd2cSJim Jagielski     return pDestBufPtr - pDestBuf;
523*b1cdbd2cSJim Jagielski }
524