ViewVC Help
View File | Revision Log | Show Annotations | Download File | Root Listing
root/radiance/ray/src/hd/rhoptimize.c
(Generate patch)

Comparing ray/src/hd/rhoptimize.c (file contents):
Revision 3.3 by gwlarson, Fri Nov 6 16:54:23 1998 UTC vs.
Revision 3.7 by gwlarson, Mon Feb 1 09:56:18 1999 UTC

# Line 1 | Line 1
1 < /* Copyright (c) 1998 Silicon Graphics, Inc. */
1 > /* Copyright (c) 1999 Silicon Graphics, Inc. */
2  
3   #ifndef lint
4   static char SCCSid[] = "$SunId$ SGI";
# Line 18 | Line 18 | static char SCCSid[] = "$SunId$ SGI";
18   #define BKBSIZE         256             /* beam clump size (kilobytes) */
19   #endif
20  
21 #define flgop(p,i,op)           ((p)[(i)>>5] op (1L<<((i)&0x1f)))
22 #define isset(p,i)              flgop(p,i,&)
23 #define setfl(p,i)              flgop(p,i,|=)
24 #define clrfl(p,i)              flgop(p,i,&=~)
25
21   char    *progname;
22   char    tempfile[128];
23 + int     dupchecking = 0;
24  
25   extern char     *rindex();
26   extern int      quit();
# Line 40 | Line 36 | char   *argv[];
36          long    nextipos, lastopos, thisopos;
37  
38          progname = argv[0];
39 <        if (argc < 2 | argc > 3) {
40 <                fprintf(stderr, "Usage: %s input.hdk [output.hdk]\n", progname);
39 >        argv++; argc--;                 /* duplicate checking flag? */
40 >        if (argc > 1 && !strcmp(argv[0], "-u")) {
41 >                dupchecking++;
42 >                argv++; argc--;
43 >        }
44 >        if (argc < 1 | argc > 2) {
45 >                fprintf(stderr, "Usage: %s [-u] input.hdk [output.hdk]\n",
46 >                                progname);
47                  exit(1);
48          }
49 <        inpname = argv[1];
50 <        if (argc == 3)                  /* use given output file */
51 <                outname = argv[2];
49 >        inpname = argv[0];              /* get input file */
50 >        argv++; argc--;
51 >        if (argc == 1)                  /* use given output file */
52 >                outname = argv[0];
53          else {                          /* else use temporary file */
54                  if (access(inpname, R_OK|W_OK) < 0) {   /* check permissions */
55                          sprintf(errmsg, "cannot access \"%s\"", inpname);
# Line 130 | Line 133 | char   *infn, *outfn;
133          fclose(infp);
134          if (fclose(outfp) == EOF)
135                  error(SYSTEM, "file flushing error in rhinitcopy");
136 <                                        /* flush everything manually hence */
137 <        hdcachesize = 0;
136 >                                        /* check cache size */
137 >        if (BKBSIZE*1024*1.5 > hdcachesize)
138 >                hdcachesize = BKBSIZE*1024*1.5;
139                                          /* return input position */
140          return(ifpos);
141   }
142  
143  
144 < gcshifti(gc, ia, di, hp)        /* shift cell row or column */
145 < register GCOORD *gc;
146 < int     ia, di;
147 < register HOLO   *hp;
144 > int
145 > nuniq(rva, n)                   /* sort unique rays to front of beam list */
146 > register RAYVAL *rva;
147 > int     n;
148   {
145        int     nw;
146
147        if (di > 0) {
148                if (++gc->i[ia] >= hp->grid[((gc->w>>1)+1+ia)%3]) {
149                        nw = ((gc->w&~1) + (ia<<1) + 3) % 6;
150                        gc->i[ia] = gc->i[1-ia];
151                        gc->i[1-ia] = gc->w&1 ? hp->grid[((nw>>1)+2-ia)%3]-1 : 0;
152                        gc->w = nw;
153                }
154        } else if (di < 0) {
155                if (--gc->i[ia] < 0) {
156                        nw = ((gc->w&~1) + (ia<<1) + 2) % 6;
157                        gc->i[ia] = gc->i[1-ia];
158                        gc->i[1-ia] = gc->w&1 ? hp->grid[((nw>>1)+2-ia)%3]-1 : 0;
159                        gc->w = nw;
160                }
161        }
162 }
163
164
165 mkneighgrid(ng, hp, gc)         /* compute neighborhood for grid cell */
166 GCOORD  ng[3*3];
167 HOLO    *hp;
168 GCOORD  *gc;
169 {
170        GCOORD  gci0;
149          register int    i, j;
150 +        RAYVAL  rtmp;
151  
152 <        for (i = 3; i--; ) {
153 <                copystruct(&gci0, gc);
154 <                gcshifti(&gci0, 0, i-1, hp);
155 <                for (j = 3; j--; ) {
156 <                        copystruct(ng+(3*i+j), &gci0);
157 <                        gcshifti(ng+(3*i+j), gci0.w==gc->w, j-1, hp);
158 <                }
159 <        }
152 >        for (j = 0; j < n; j++)
153 >                for (i = j+1; i < n; i++)
154 >                        if ( rva[i].d == rva[j].d &&
155 >                                        rva[i].r[0][0]==rva[j].r[0][0] &&
156 >                                        rva[i].r[0][1]==rva[j].r[0][1] &&
157 >                                        rva[i].r[1][0]==rva[j].r[1][0] &&
158 >                                        rva[i].r[1][1]==rva[j].r[1][1] ) {
159 >                                n--;            /* swap duplicate with end */
160 >                                copystruct(&rtmp, rva+n);
161 >                                copystruct(rva+n, rva+i);
162 >                                copystruct(rva+i, &rtmp);
163 >                                i--;            /* recheck one we swapped */
164 >                        }
165 >        return(n);
166   }
167  
168  
169 < int     bneighlist[9*9-1];
185 < int     bneighrem;
169 > static BEAMI    *beamdir;
170  
171 < #define nextneigh()     (bneighrem<=0 ? 0 : bneighlist[--bneighrem])
172 <
173 < int
190 < firstneigh(hp, b)               /* initialize neighbor list and return first */
191 < HOLO    *hp;
192 < int     b;
171 > static int
172 > bpcmp(b1p, b2p)                 /* compare beam positions on disk */
173 > int     *b1p, *b2p;
174   {
175 <        GCOORD  wg0[9], wg1[9], bgc[2];
195 <        int     i, j;
175 >        register long   pdif = beamdir[*b1p].fo - beamdir[*b2p].fo;
176  
177 <        hdbcoord(bgc, hp, b);
178 <        mkneighgrid(wg0, hp, bgc);
199 <        mkneighgrid(wg1, hp, bgc+1);
200 <        bneighrem = 0;
201 <        for (i = 9; i--; )
202 <                for (j = 9; j--; ) {
203 <                        if (i == 4 & j == 4)    /* don't copy starting beam */
204 <                                continue;
205 <                        if (wg0[i].w == wg1[j].w)
206 <                                continue;
207 <                        copystruct(bgc, wg0+i);
208 <                        copystruct(bgc+1, wg1+j);
209 <                        bneighlist[bneighrem++] = hdbindex(hp, bgc);
210 < #ifdef DEBUG
211 <                        if (bneighlist[bneighrem-1] <= 0)
212 <                                error(CONSISTENCY, "bad beam in firstneigh");
213 < #endif
214 <                }
215 <        return(nextneigh());
177 >        if (pdif < 0L) return(-1);
178 >        return(pdif > 0L);
179   }
180  
181 + static HOLO     *hout;
182  
183 < BEAMI   *beamdir;
184 <
185 < int
186 < bpcmp(b1p, b2p)                 /* compare beam positions on disk */
223 < int     *b1p, *b2p;
183 > static int
184 > xferclump(hp, bq, nb)           /* transfer the given clump to hout and free */
185 > HOLO    *hp;
186 > int     *bq, nb;
187   {
188 <        register long   pdif = beamdir[*b1p].fo - beamdir[*b2p].fo;
188 >        register int    i;
189 >        register BEAM   *bp;
190 >        int     n;
191  
192 <        if (pdif > 0L) return(1);
193 <        if (pdif < 0L) return(-1);
192 >        beamdir = hp->bi;               /* sort based on file position */
193 >        qsort((char *)bq, nb, sizeof(*bq), bpcmp);
194 >                                        /* transfer and free each beam */
195 >        for (i = 0; i < nb; i++) {
196 >                bp = hdgetbeam(hp, bq[i]);
197 >                DCHECK(bp==NULL, CONSISTENCY, "empty beam in xferclump");
198 >                n = dupchecking ? nuniq(hdbray(bp),bp->nrm) : bp->nrm;
199 >                bcopy((char *)hdbray(bp), (char *)hdnewrays(hout,bq[i],n),
200 >                                n*sizeof(RAYVAL));
201 >                hdfreebeam(hp, bq[i]);
202 >        }
203 >        hdfreebeam(hout, 0);            /* write & free clump */
204          return(0);
205   }
206  
232
207   copysect(ifd, ofd)              /* copy holodeck section from ifd to ofd */
208   int     ifd, ofd;
209   {
210 <        static short    primes[] = {9431,6803,4177,2659,1609,887,587,251,47,1};
237 <        register HOLO   *hinp;
238 <        HOLO    *hout;
239 <        register BEAM   *bp;
240 <        unsigned int4   *bflags;
241 <        int     *bqueue;
242 <        int     bqlen;
243 <        int4    bqtotal;
244 <        int     bc, bci, bqc, myprime;
245 <        register int    i;
210 >        HOLO    *hinp;
211                                          /* load input section directory */
212          hinp = hdinit(ifd, NULL);
213                                          /* create output section directory */
214          hout = hdinit(ofd, (HDGRID *)hinp);
215 <                                        /* allocate beam queue */
216 <        bqueue = (int *)malloc(nbeams(hinp)*sizeof(int));
217 <        bflags = (unsigned int4 *)calloc((nbeams(hinp)>>5)+1,
253 <                        sizeof(unsigned int4));
254 <        if (bqueue == NULL | bflags == NULL)
255 <                error(SYSTEM, "out of memory in copysect");
256 <                                        /* mark empty beams as done */
257 <        for (i = nbeams(hinp); i > 0; i--)
258 <                if (!hinp->bi[i].nrd)
259 <                        setfl(bflags, i);
260 <                                        /* pick a good prime step size */
261 <        for (i = 0; primes[i]<<5 >= nbeams(hinp); i++)
262 <                ;
263 <        while ((myprime = primes[i++]) > 1)
264 <                if (nbeams(hinp) % myprime)
265 <                        break;
266 <                                        /* add each input beam and neighbors */
267 <        for (bc = bci = nbeams(hinp); bc > 0; bc--,
268 <                        bci += bci>myprime ? -myprime : nbeams(hinp)-myprime) {
269 <                if (isset(bflags, bci))
270 <                        continue;
271 <                bqueue[0] = bci;                /* initialize queue */
272 <                bqlen = 1;
273 <                bqtotal = hinp->bi[bci].nrd;
274 <                setfl(bflags, bci);
275 <                                                /* run through growing queue */
276 <                for (bqc = 0; bqc < bqlen; bqc++) {
277 <                                                /* add neighbors until full */
278 <                        for (i = firstneigh(hinp,bqueue[bqc]); i > 0;
279 <                                        i = nextneigh()) {
280 <                                if (isset(bflags, i))   /* done already? */
281 <                                        continue;
282 <                                bqueue[bqlen++] = i;    /* add it */
283 <                                bqtotal += hinp->bi[i].nrd;
284 <                                setfl(bflags, i);
285 <                                if (bqtotal >= BKBSIZE*1024/sizeof(RAYVAL))
286 <                                        break;          /* queue full */
287 <                        }
288 <                        if (i > 0)
289 <                                break;
290 <                }
291 <                beamdir = hinp->bi;             /* sort queue */
292 <                qsort((char *)bqueue, bqlen, sizeof(*bqueue), bpcmp);
293 <                                                /* transfer each beam */
294 <                for (i = 0; i < bqlen; i++) {
295 <                        bp = hdgetbeam(hinp, bqueue[i]);
296 <                        bcopy((char *)hdbray(bp),
297 <                                (char *)hdnewrays(hout,bqueue[i],bp->nrm),
298 <                                        bp->nrm*sizeof(RAYVAL));
299 <                        hdfreebeam(hinp, bqueue[i]);
300 <                }
301 <                hdfreebeam(hout, 0);            /* flush output block */
302 < #ifdef DEBUG
303 <                hdsync(hout, 0);
304 < #endif
305 <        }
306 <                                        /* we're done -- clean up */
307 <        free((char *)bqueue);
308 <        free((char *)bflags);
215 >                                        /* clump the beams */
216 >        clumpbeams(hinp, 0, BKBSIZE*1024, xferclump);
217 >                                        /* clean up */
218          hddone(hinp);
219          hddone(hout);
220   }

Diff Legend

Removed lines
+ Added lines
< Changed lines
> Changed lines