ViewVC Help
View File | Revision Log | Show Annotations | Download File | Root Listing
root/radiance/ray/src/hd/rhoptimize.c
(Generate patch)

Comparing ray/src/hd/rhoptimize.c (file contents):
Revision 3.3 by gwlarson, Fri Nov 6 16:54:23 1998 UTC vs.
Revision 3.18 by schorsch, Thu Jan 1 11:21:55 2004 UTC

# Line 1 | Line 1
1 /* Copyright (c) 1998 Silicon Graphics, Inc. */
2
1   #ifndef lint
2 < static char SCCSid[] = "$SunId$ SGI";
2 > static const char       RCSid[] = "$Id$";
3   #endif
6
4   /*
5   * Optimize holodeck for quick access.
6   *
7   *      11/4/98         Greg Ward Larson
8   */
9  
13 #include "holo.h"
14
10   #include <signal.h>
11 + #include <string.h>
12 + #include <stdio.h>
13  
14 + #include "platform.h"
15 + #include "rterror.h"
16 + #include "resolu.h"
17 + #include "rtprocess.h" /* getpid() */
18 + #include "holo.h"
19 +
20   #ifndef BKBSIZE
21   #define BKBSIZE         256             /* beam clump size (kilobytes) */
22   #endif
23  
21 #define flgop(p,i,op)           ((p)[(i)>>5] op (1L<<((i)&0x1f)))
22 #define isset(p,i)              flgop(p,i,&)
23 #define setfl(p,i)              flgop(p,i,|=)
24 #define clrfl(p,i)              flgop(p,i,&=~)
25
24   char    *progname;
25   char    tempfile[128];
26 + int     dupchecking = 0;
27  
28 < extern char     *rindex();
29 < extern int      quit();
30 < extern long     rhinitcopy();
28 > static long rhinitcopy(int hfd[2], char *infn, char *outfn);
29 > static int nuniq(RAYVAL *rva, int n);
30 > static int bpcmp(const void *b1p, const void *b2p);
31 > static int xferclump(HOLO *hp, int *bq, int nb);
32 > static void copysect(int ifd, int ofd);
33  
34  
35 < main(argc, argv)
36 < int     argc;
37 < char    *argv[];
35 > int
36 > main(
37 >        int     argc,
38 >        char    *argv[]
39 > )
40   {
41          char    *inpname, *outname;
42          int     hdfd[2];
43          long    nextipos, lastopos, thisopos;
44  
45          progname = argv[0];
46 <        if (argc < 2 | argc > 3) {
47 <                fprintf(stderr, "Usage: %s input.hdk [output.hdk]\n", progname);
46 >        argv++; argc--;                 /* duplicate checking flag? */
47 >        if (argc > 1 && !strcmp(argv[0], "-u")) {
48 >                dupchecking++;
49 >                argv++; argc--;
50 >        }
51 >        if ((argc < 1) | (argc > 2)) {
52 >                fprintf(stderr, "Usage: %s [-u] input.hdk [output.hdk]\n",
53 >                                progname);
54                  exit(1);
55          }
56 <        inpname = argv[1];
57 <        if (argc == 3)                  /* use given output file */
58 <                outname = argv[2];
56 >        inpname = argv[0];              /* get input file */
57 >        argv++; argc--;
58 >        if (argc == 1)                  /* use given output file */
59 >                outname = argv[0];
60          else {                          /* else use temporary file */
61                  if (access(inpname, R_OK|W_OK) < 0) {   /* check permissions */
62                          sprintf(errmsg, "cannot access \"%s\"", inpname);
63                          error(SYSTEM, errmsg);
64                  }
65                  strcpy(tempfile, inpname);
66 <                if ((outname = rindex(tempfile, '/')) != NULL)
66 >                if ((outname = strrchr(tempfile, '/')) != NULL)
67                          outname++;
68                  else
69                          outname = tempfile;
# Line 65 | Line 75 | char   *argv[];
75          lastopos = 0L;                  /* copy sections one by one */
76          while (nextipos != 0L) {
77                                          /* set input position; get next */
78 <                lseek(hdfd[0], nextipos, 0);
78 >                lseek(hdfd[0], (off_t)nextipos, SEEK_SET);
79                  read(hdfd[0], (char *)&nextipos, sizeof(nextipos));
80                                          /* get output position; set last */
81 <                thisopos = lseek(hdfd[1], 0L, 2);
81 >                thisopos = lseek(hdfd[1], (off_t)0, SEEK_END);
82                  if (lastopos > 0L) {
83 <                        lseek(hdfd[1], lastopos, 0);
83 >                        lseek(hdfd[1], (off_t)lastopos, SEEK_SET);
84                          write(hdfd[1], (char *)&thisopos, sizeof(thisopos));
85 <                        lseek(hdfd[1], 0L, 2);
85 >                        lseek(hdfd[1], (off_t)0, SEEK_END);
86                  }
87                  lastopos = thisopos;
88                  thisopos = 0L;          /* write place holder */
# Line 88 | Line 98 | char   *argv[];
98                                  outname, inpname);
99                  error(SYSTEM, errmsg);
100          }
101 <        exit(0);
101 >        return 0;
102   }
103  
104  
105 < long
106 < rhinitcopy(hfd, infn, outfn)    /* open files and copy header */
107 < int     hfd[2];                 /* returned file descriptors */
108 < char    *infn, *outfn;
105 > static long
106 > rhinitcopy(     /* open files and copy header */
107 >        int     hfd[2],                 /* returned file descriptors */
108 >        char    *infn,
109 >        char    *outfn
110 > )
111   {
112          FILE    *infp, *outfp;
113          long    ifpos;
# Line 104 | Line 116 | char   *infn, *outfn;
116                  sprintf(errmsg, "cannot open \"%s\" for reading", infn);
117                  error(SYSTEM, errmsg);
118          }
119 +        if (access(outfn, F_OK) == 0) {
120 +                sprintf(errmsg, "output file \"%s\" already exists!", outfn);
121 +                error(USER, errmsg);
122 +        }
123          if ((outfp = fopen(outfn, "w+")) == NULL) {
124                  sprintf(errmsg, "cannot open \"%s\" for writing", outfn);
125                  error(SYSTEM, errmsg);
# Line 130 | Line 146 | char   *infn, *outfn;
146          fclose(infp);
147          if (fclose(outfp) == EOF)
148                  error(SYSTEM, "file flushing error in rhinitcopy");
149 <                                        /* flush everything manually hence */
150 <        hdcachesize = 0;
149 >                                        /* check cache size */
150 >        if (BKBSIZE*1024*1.5 > hdcachesize)
151 >                hdcachesize = BKBSIZE*1024*1.5;
152                                          /* return input position */
153          return(ifpos);
154   }
155  
156  
157 < gcshifti(gc, ia, di, hp)        /* shift cell row or column */
158 < register GCOORD *gc;
159 < int     ia, di;
160 < register HOLO   *hp;
157 > static int
158 > nuniq(                  /* sort unique rays to front of beam list */
159 >        register RAYVAL *rva,
160 >        int     n
161 > )
162   {
145        int     nw;
146
147        if (di > 0) {
148                if (++gc->i[ia] >= hp->grid[((gc->w>>1)+1+ia)%3]) {
149                        nw = ((gc->w&~1) + (ia<<1) + 3) % 6;
150                        gc->i[ia] = gc->i[1-ia];
151                        gc->i[1-ia] = gc->w&1 ? hp->grid[((nw>>1)+2-ia)%3]-1 : 0;
152                        gc->w = nw;
153                }
154        } else if (di < 0) {
155                if (--gc->i[ia] < 0) {
156                        nw = ((gc->w&~1) + (ia<<1) + 2) % 6;
157                        gc->i[ia] = gc->i[1-ia];
158                        gc->i[1-ia] = gc->w&1 ? hp->grid[((nw>>1)+2-ia)%3]-1 : 0;
159                        gc->w = nw;
160                }
161        }
162 }
163
164
165 mkneighgrid(ng, hp, gc)         /* compute neighborhood for grid cell */
166 GCOORD  ng[3*3];
167 HOLO    *hp;
168 GCOORD  *gc;
169 {
170        GCOORD  gci0;
163          register int    i, j;
164 +        RAYVAL  rtmp;
165  
166 <        for (i = 3; i--; ) {
167 <                copystruct(&gci0, gc);
168 <                gcshifti(&gci0, 0, i-1, hp);
169 <                for (j = 3; j--; ) {
170 <                        copystruct(ng+(3*i+j), &gci0);
171 <                        gcshifti(ng+(3*i+j), gci0.w==gc->w, j-1, hp);
172 <                }
173 <        }
166 >        for (j = 0; j < n; j++)
167 >                for (i = j+1; i < n; i++)
168 >                        if ( rva[i].d == rva[j].d &&
169 >                                        rva[i].r[0][0]==rva[j].r[0][0] &&
170 >                                        rva[i].r[0][1]==rva[j].r[0][1] &&
171 >                                        rva[i].r[1][0]==rva[j].r[1][0] &&
172 >                                        rva[i].r[1][1]==rva[j].r[1][1] ) {
173 >                                n--;            /* swap duplicate with end */
174 >                                rtmp = *(rva+n);
175 >                                *(rva+n) = *(rva+i);
176 >                                *(rva+i) = rtmp;
177 >                                i--;            /* recheck one we swapped */
178 >                        }
179 >        return(n);
180   }
181  
182  
183 < int     bneighlist[9*9-1];
185 < int     bneighrem;
183 > static BEAMI    *beamdir;
184  
185 < #define nextneigh()     (bneighrem<=0 ? 0 : bneighlist[--bneighrem])
186 <
187 < int
188 < firstneigh(hp, b)               /* initialize neighbor list and return first */
189 < HOLO    *hp;
192 < int     b;
185 > static int
186 > bpcmp(                  /* compare beam positions on disk */
187 >        const void      *b1p,
188 >        const void      *b2p
189 > )
190   {
191 <        GCOORD  wg0[9], wg1[9], bgc[2];
195 <        int     i, j;
191 >        register off_t  pdif = beamdir[*(int*)b1p].fo - beamdir[*(int*)b2p].fo;
192  
193 <        hdbcoord(bgc, hp, b);
194 <        mkneighgrid(wg0, hp, bgc);
199 <        mkneighgrid(wg1, hp, bgc+1);
200 <        bneighrem = 0;
201 <        for (i = 9; i--; )
202 <                for (j = 9; j--; ) {
203 <                        if (i == 4 & j == 4)    /* don't copy starting beam */
204 <                                continue;
205 <                        if (wg0[i].w == wg1[j].w)
206 <                                continue;
207 <                        copystruct(bgc, wg0+i);
208 <                        copystruct(bgc+1, wg1+j);
209 <                        bneighlist[bneighrem++] = hdbindex(hp, bgc);
210 < #ifdef DEBUG
211 <                        if (bneighlist[bneighrem-1] <= 0)
212 <                                error(CONSISTENCY, "bad beam in firstneigh");
213 < #endif
214 <                }
215 <        return(nextneigh());
193 >        if (pdif < 0L) return(-1);
194 >        return(pdif > 0L);
195   }
196  
197 + static HOLO     *hout;
198  
199 < BEAMI   *beamdir;
200 <
201 < int
202 < bpcmp(b1p, b2p)                 /* compare beam positions on disk */
203 < int     *b1p, *b2p;
199 > static int
200 > xferclump(              /* transfer the given clump to hout and free */
201 >        HOLO    *hp,
202 >        int     *bq,
203 >        int     nb
204 > )
205   {
206 <        register long   pdif = beamdir[*b1p].fo - beamdir[*b2p].fo;
206 >        register int    i;
207 >        register BEAM   *bp;
208 >        int     n;
209  
210 <        if (pdif > 0L) return(1);
211 <        if (pdif < 0L) return(-1);
210 >        beamdir = hp->bi;               /* sort based on file position */
211 >        qsort((void *)bq, nb, sizeof(*bq), bpcmp);
212 >                                        /* transfer and free each beam */
213 >        for (i = 0; i < nb; i++) {
214 >                bp = hdgetbeam(hp, bq[i]);
215 >                DCHECK(bp==NULL, CONSISTENCY, "empty beam in xferclump");
216 >                n = dupchecking ? nuniq(hdbray(bp),bp->nrm) : bp->nrm;
217 >                memcpy((void *)hdnewrays(hout,bq[i],n),(void *)hdbray(bp),
218 >                                n*sizeof(RAYVAL));
219 >                hdfreebeam(hp, bq[i]);
220 >        }
221 >        hdfreebeam(hout, 0);            /* write & free clump */
222          return(0);
223   }
224  
225 <
226 < copysect(ifd, ofd)              /* copy holodeck section from ifd to ofd */
227 < int     ifd, ofd;
225 > static void
226 > copysect(               /* copy holodeck section from ifd to ofd */
227 >        int     ifd,
228 >        int     ofd
229 > )
230   {
231 <        static short    primes[] = {9431,6803,4177,2659,1609,887,587,251,47,1};
237 <        register HOLO   *hinp;
238 <        HOLO    *hout;
239 <        register BEAM   *bp;
240 <        unsigned int4   *bflags;
241 <        int     *bqueue;
242 <        int     bqlen;
243 <        int4    bqtotal;
244 <        int     bc, bci, bqc, myprime;
245 <        register int    i;
231 >        HOLO    *hinp;
232                                          /* load input section directory */
233          hinp = hdinit(ifd, NULL);
234                                          /* create output section directory */
235          hout = hdinit(ofd, (HDGRID *)hinp);
236 <                                        /* allocate beam queue */
237 <        bqueue = (int *)malloc(nbeams(hinp)*sizeof(int));
238 <        bflags = (unsigned int4 *)calloc((nbeams(hinp)>>5)+1,
253 <                        sizeof(unsigned int4));
254 <        if (bqueue == NULL | bflags == NULL)
255 <                error(SYSTEM, "out of memory in copysect");
256 <                                        /* mark empty beams as done */
257 <        for (i = nbeams(hinp); i > 0; i--)
258 <                if (!hinp->bi[i].nrd)
259 <                        setfl(bflags, i);
260 <                                        /* pick a good prime step size */
261 <        for (i = 0; primes[i]<<5 >= nbeams(hinp); i++)
262 <                ;
263 <        while ((myprime = primes[i++]) > 1)
264 <                if (nbeams(hinp) % myprime)
265 <                        break;
266 <                                        /* add each input beam and neighbors */
267 <        for (bc = bci = nbeams(hinp); bc > 0; bc--,
268 <                        bci += bci>myprime ? -myprime : nbeams(hinp)-myprime) {
269 <                if (isset(bflags, bci))
270 <                        continue;
271 <                bqueue[0] = bci;                /* initialize queue */
272 <                bqlen = 1;
273 <                bqtotal = hinp->bi[bci].nrd;
274 <                setfl(bflags, bci);
275 <                                                /* run through growing queue */
276 <                for (bqc = 0; bqc < bqlen; bqc++) {
277 <                                                /* add neighbors until full */
278 <                        for (i = firstneigh(hinp,bqueue[bqc]); i > 0;
279 <                                        i = nextneigh()) {
280 <                                if (isset(bflags, i))   /* done already? */
281 <                                        continue;
282 <                                bqueue[bqlen++] = i;    /* add it */
283 <                                bqtotal += hinp->bi[i].nrd;
284 <                                setfl(bflags, i);
285 <                                if (bqtotal >= BKBSIZE*1024/sizeof(RAYVAL))
286 <                                        break;          /* queue full */
287 <                        }
288 <                        if (i > 0)
289 <                                break;
290 <                }
291 <                beamdir = hinp->bi;             /* sort queue */
292 <                qsort((char *)bqueue, bqlen, sizeof(*bqueue), bpcmp);
293 <                                                /* transfer each beam */
294 <                for (i = 0; i < bqlen; i++) {
295 <                        bp = hdgetbeam(hinp, bqueue[i]);
296 <                        bcopy((char *)hdbray(bp),
297 <                                (char *)hdnewrays(hout,bqueue[i],bp->nrm),
298 <                                        bp->nrm*sizeof(RAYVAL));
299 <                        hdfreebeam(hinp, bqueue[i]);
300 <                }
301 <                hdfreebeam(hout, 0);            /* flush output block */
302 < #ifdef DEBUG
303 <                hdsync(hout, 0);
304 < #endif
305 <        }
306 <                                        /* we're done -- clean up */
307 <        free((char *)bqueue);
308 <        free((char *)bflags);
236 >                                        /* clump the beams */
237 >        clumpbeams(hinp, 0, BKBSIZE*1024, xferclump);
238 >                                        /* clean up */
239          hddone(hinp);
240          hddone(hout);
241   }
242  
243  
244 + void
245   eputs(s)                        /* put error message to stderr */
246   register char  *s;
247   {
# Line 330 | Line 261 | register char  *s;
261   }
262  
263  
264 + void
265   quit(code)                      /* exit the program gracefully */
266   int     code;
267   {

Diff Legend

Removed lines
+ Added lines
< Changed lines
> Changed lines